DATA SCIENCE

CERTIFICACIÓN AVANZADA

 

ÁREA: TIC

MODALIDAD: Virtual

ESTADO: Inscripción Abierta

Charla informativa: 27/02/2025

INICIO: 25/03/2025

FINALIZACIÓN: 02/09/2025

Big data se refiere a las grandes colecciones de datos, estructurados, o no estructurados, que pueden crecer a volúmenes enormes y a un ritmo tan alto que es complejo manejarlos con las técnicas habituales de los sistemas de bases de datos y las herramientas de análisis existentes hasta hace un tiempo.

La gestión y el análisis de estas cantidades masivas de datos exigen nuevas soluciones que van más allá de los procesos tradicionales o herramientas de software habituales en la práctica diaria, lo que ha llevado a acuñar el término “big data analytics”.

La Certificación Avanzada en Data Science está orientada a facilitar el conocimiento de las herramientas que permiten diseñar, preparar, analizar y manejar información, estructurada y no-estructurada.

 


 

OBJETIVOS

Comprender los pasos centrales del workflow de un proyecto de data science, desde la comprensión del problema hasta la construcción de modelos y visualización de los resultados.

Adquirir las habilidades necesarias para formar parte de un equipo de data science: modelado, diseño y consultas (utilizando SQL) de bases de datos y data warehouses, construcción de modelos de machine learning utilizando R (y opcionalmente Python) y manejo de otros tipos de datos más allá de las bases de datos relacionales, como datos geográficos y bases de datos de grafos.

 


 

PERFIL DEL PARTICIPANTE

Profesionales de cualquier área o especialidad, que quieran adquirir conocimientos sobre técnicas y herramientas que les permitan aplicar el análisis de datos en sus actividades.

 


 

METODOLOGÍA

Durante la certificación se realizarán encuentros sincrónicos de desarrollo de contenido, presentación de materiales y trabajos grupales. De forma asincrónica se compartirán materiales que los y las estudiantes deberán revisar y actividades que refuercen lo trabajado en los encuentros sincrónicos.

Cada módulo se desarrolla según la dinámica que mejor se adecue a las características de los temas a impartir. En algunos módulos de desarrolla un proyecto de principio a fin, y en otros cursos el sistema consiste en explicar cada tema y resolver un trabajo práctico relacionado.

 


 

CONOCIMIENTOS ADQUIRIDOS AL FINALIZAR EL PROGRAMA

  1. Creación y desarrollo de modelos de datos para el análisis de diversos escenarios que requieran el uso de datos para la toma de decisiones.
  2. Integración de datos provenientes de diversas fuentes y técnicas para asegurar su consistencia.
  3. Modelado e implementación de data warehouses.
  4. Manejo de diferentes tipos de datos, en particular datos geográficos y bases de datos de grafos (para el análisis de redes).
  5. Creación de visualizaciones que ayuden a entender los data sets.
  6. Construcción y análisis de modelos de machine learning
  7. Presentación y comunicación de resultados y hallazgos (incluso para una audiencia inexperta).

     


     

    CONOCIMIENTOS MÍNIMOS PARA CURSAR EL PROGRAMA

    Conocimientos de Bases de Datos y SQL. Se tomará una evaluación en base a los contenidos del curso de nivelación. El curso de Nivelación es un curso de conceptos básicos de Base de Datos y SQL. El curso es opcional, el examen es obligatorio. Se recomienda ver y hacer el curso a todos/as los participantes.

    Todo el software utilizado en el curso es open source. Se sugiere una computadora con un mínimo de 16GB de RAM y procesador mínimo i5 o equivalente.

Plan de estudios

Todos collapsables cerrados

Este accordion está para que todos los ítems permanezcan cerrados

CURSO DE NIVELACIÓN

Conceptos básicos de Base de datos y SQL.

Data Warehousing & OLAP
  • Modelos de datos.
  • Análisis de requerimientos.
  • Diseño conceptual, lógico y físico.
  • El modelo multidimensional: estrella, snowlflake y constellation.
  • Manejo de cambios: Slowly changing dimensions.
  • Diseño físico.
  • Online Analytical Processing: OLAP. OLAP vd OLTP.
  • SQL/OLAP: funciones de ventana.
Módulo 2: Inteligencia Artificial y Machile Learning
  • Conceptos básicos de Machine Learning.
  • Modelos descriptivos y predictivos.
  • Técnicas fundamentales: clasificación, clustering, patrones.
  • Árboles de decisión.
  • Aplicación a problemas concretos de predicción.
  • Casos de estudio.
  • Redes Neuronales.
Módulo 3: Sistemas de Información Geográfica y Bases de Datos de Grafos

Parte 1:

  • Bases de datos espaciales.
  • Open Geospatial Consortium (OGC): objetos geométricos y geográficos.
  • Lenguaje de Consulta: funciones y predicados para el análisis espacial.
  • Concepto de índice espacial.
  • Visualización de resultados en QGIS y OpenJump.

Parte 2:

  • Bases de datos de grafos NoSQL.
  • Modelado de Property Graphs.
  • Lenguaje de Consulta: búsqueda de patrones y uso de agregaciones. Soporte para el análisis de datos espaciales.
Módulo 4: Visualización de la Información
  • Introducción, definiciones, antecedentes, gráficos notables.
  • Principios de la excelencia gráfica. Observaciones y variables. Tipo de variables.
  • Visualizando tablas, jerarquías y redes. Utilización del color. Representación
  • eficiente de la información, sumarización y visualización de
  • grandes volúmenes de datos. Prácticas con d3js, jit, Processing, Google
  • Visualization API, Tableau, Fusion Tables.

Conocé al coordinador académico

Alejandro Vaisman

Alejandro es Doctor en Ciencias de la Computación por la Universidad de Buenos Aires. Postdoctorado en la Universidad de Toronto, Canadá. Es especialista en Data Warehousing y Business Intelligence (BI), Data Mining, Sistemas de Información Geográfica (GIS), y en publicación de datos en la web, siguiendo los lineamientos de Linked Open Data. Co-autor, junto con el Prof. Esteban Zimányi (Universidad Libre de Bruselas) del libro “Data Warehouse Systems: Design and Implementation”. Ha publicado, además, 5 capítulos en libros internacionales y ha publicado artículos en las más prestigiosas revistas y conferencias de la especialidad.

Cuerpo docente

Todos collapsables cerrados

Este accordion está para que todos los ítems permanezcan cerrados

Marcela Riccillo

Doctora en Ciencias de la Computación de la Universidad de Buenos Aires, especialista en Inteligencia Artificial y Robótica. Cuenta con +15 años de experiencia en empresas e instituciones llevando a cabo proyectos de consultoría en tecnología de la información e IA aplicada a la industria. Ha realizado conferencias en eventos nacionales e internacionales y charlas TED, como TEDxRosario, y TEDxBarcelona. Tiene publicados trabajos de investigación en IA. Es, además, docente universitaria en IA, Robótica, Data Mining, Machine Learning, y Redes Neuronales. También reliza tareas de divulgación científica, entre ellas, fue columnista de Robótica en  Radio Palermo, y jurado en el programa de ciencia de TV Eureka de Canal Encuentro.

Valeria Soliani

Lic. en Cs. de la Computación (FCEyN – UBA). Especialista en Cs. de Datos (ITBA). Candidata a Dra. en Computación por ITBA y Universidad de Hasselt (Bélgica). Profesora Adjunta, área Bases de Datos (ITBA), Profesora en la Especialización en Cs. de Datos (ITBA). Ex- Gerente de Alianzas y Canales en Informix Software de Argentina.

Todos collapsables cerrados

Este accordion está para que todos los ítems permanezcan cerrados

Leticia Gómez

Es Licenciada en Ciencias de la Computación de la UBA y Doctora en Ingeniería en Informática del ITBA. Ha participado en diferentes proyectos en el área de Data Warhousing como “Diseño e Implementación de Herramientas para la Administración y Análisis de la Evolución de Datos Complejos en Big Data Utilizando Bases de Datos de Grafos” y “Big Data Cubes: Publicación y Análisis de Datos Multidimensionales en la Web Semántica en Tiempo Casi-Real”. Directora del Proyecto FITAP 008 “Desarrollo de Laboratorio de Seguimiento de Ojos para Medición de Usabilidad en SaaS”, MINCYT, Argentina.

Actualmente es miembro del comité de UXQCC (User Experience Quality Certification Center) en UXPA, UXQCC. Es investigadora en el área de Bases de Datos, Business Intelligence (Online Analytical Processing y Data Mining) y Grafos. Ha realizado publicaciones en diferentes revistas científicas internacionales

Es docente titular en el Departamento de Ingeniería informática del ITBA.

Ariel Aizemberg

Licenciado en Ciencias de la Computación, Depto de Computación, FCEyN, UBA. 25 años de experiencia docente (Inteligencia Artificial, Sistemas Expertos, Data Mining y Visualización de Información, 10 años como consultor independiente en las siguientes áreas: Spatial Databases, GIS, Data Quality, InfoVis y BI. Se desempeñó también como responsable de desarrollos GIS en diferentes organizaciones.

Modalidad

Modalidad: Virtual
Mail de bienvenida + envío de material nivelatorio: martes 25 de marzo (este día no se cursa)
Clase de consulta 1: martes 1 de abril
Clase de consulta 2: martes 8 de abril
Exámen nivelatorio: martes 15 de abril
Inicio – 1° clase sincrónica: martes 22 de abril
Tutorías optativas: miércoles de 18 a 19 hs. (inician el 23/4)
Duración: 119 hs – 34 clases 
Fin de curso: martes 2 de septiembre
Cursada: martes y jueves de 18 a 21.30 hs
Titulación: Certificado Avanzado en Data Science

Requisitos:

La Certificación Avanzada en Data Science tiene un curso de nivelación. En el mismo se dictan conceptos básicos de Base de Datos y SQL y contiene un examen obligatorio. Es condición para continuar con la cursada el programa haber aprobado el examen del curso de nivelación. Su duración es de cuatro semanas y se cursa asincronicamente con posibilidad de tutoreo a cargo del docente.

Para conocer más sobre el programa y/o avanzar con el proceso de inscripción completá el formulario de consulta de la Certificación Avanzada en Data Science.

educacionejecutiva@itba.edu.ar
innovacion.itba.edu.ar

Conocé más sobre el ITBA