Skip to content

Specialization thesis for the M.Sc. in Data Science. Missing data imputation using SVM models and NMDS techniques. DAta cleaning and exploratory analysis.

Notifications You must be signed in to change notification settings

VicColombo/linea_137_llamados_vs

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

linea_137_llamados_vs

Motivation

Argentina’s national hotline 137 is a free public service offering assistance in cases of domestic and/or sexual violence. It originated as part of the Las Víctimas contra las Violencias (Victims Against Violence) program.

As part of the Data Science Specialization at the Faculty of Exact Sciences, University of Buenos Aires (UBA), this project analyzes calls made to hotline 137 reporting sexual violence between 2017 and 2021. It also presents two experiments training SVM classifiers to fill in missing data for the variable indicating whether the victim lives with the aggressor or not.

Repository Guide

  • datasets/csv: contains raw call data from 01/2017 to 08/2021.

  • datasets/xlsx: stores datasets generated by various scripts.

  • code/scripts: includes limpieza_normalizacion.py – merges, cleans, and normalizes the data, generating datasets for Experiments 1 and 2.

herramientas.py – helper functions used by the main script.

  • code/notebooks: contains one exploratory notebook, one for NMDS visualizations, and three for the SVM experiments.

  • _latex: LaTeX files with the written report.

linea_137_llamados_vs

Motivación

La línea telefónica nacional argentina 137 es un servicio público y gratuito para solicitar asistencia en casos de violencia familiar y/o sexual, nacida del programa Las Víctimas contra las Violencias. En el marco del trabajo para la Especialización en Ciencia de DAtos de la Facultad de Ciencias Exactas de la UBA, analizo los llamados a la línea 137 para reportar violencia sexual entre 2017 y 2021 y propongo dos experimentos para entrenar clasificadores SVM que imputen los datos faltantes para la variable que codifica si la víctima convive o no con su agresor.

Guía del repositorio

  • datasets/csv: contiene los llamados en crudo desde 01/2017 hasta 08/2021.
  • datasets/xlsx: carpeta para guardar algunos datasets generados por los distintos scripts.
  • code/scripts: contiene limpieza_normalizacion.py donde unifico, normalizo y limpio los datos, y genero los datasets para los experimentos 1 y 2. Y contiene herramientas.py con funciones auxiliares para el script anterior.
  • code/notebooks: contiene una notebook de exploración, una para graficar nmds, y tres con los experimentos 1 y 2 de svm.
  • _latex: contiene los archivos de Latex con el trabajo escrito.

About

Specialization thesis for the M.Sc. in Data Science. Missing data imputation using SVM models and NMDS techniques. DAta cleaning and exploratory analysis.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published