Data science

Big data se refiere a las grandes colecciones de datos, estructurados, o no estructurados, que pueden crecer a volúmenes enormes y a un ritmo tan alto que es complejo manejarlos con las técnicas habituales de los sistemas de bases de datos y las herramientas de análisis existentes hasta hace un tiempo.

La gestión y el análisis de estas cantidades masivas de datos exigen nuevas soluciones que van más allá de los procesos tradicionales o herramientas de software habituales en la práctica diaria, lo que ha llevado a acuñar el término “big data analytics”.

La Certificación Avanzada en Data Science está orientada a facilitar el conocimiento de las herramientas que permiten diseñar, preparar, analizar y manejar información, estructurada y no-estructurada. 

Las habilidades que desarrollarás:

  1. Manejo de grandes cantidades de datos, independientemente de restricciones de hardware,software y ancho de banda.
  2. Integración datos provenientes de diversas fuentes y cómo asegurar su consistencia.
  3. Creación de visualizaciones que ayuden a entender los data sets.
  4. Construcción de modelos matemáticos con los datos.
  5. Presentación y comunicación de resultados y hallazgos (incluso para una audiencia inexperta).

 

    Para recibir más información, contactanos a través del formulario de consulta



















    Inicio mail de bienvenida: 4/04/2023

    Fin:
    17/08/2023

    Cursada: 
    Martes y jueves de 18 a 21:30 hs. (Tutoreo online miércoles de 19 a 20 hs.)

    Duración:
    18 semanas (119 hs.)

    Modalidad: Virtual

    Precio: 1.500 USD.-

    Medios de Pago: Paypal o Bitso

    Beneficio por pronta inscripción hasta el 15/03: 1.275 USD.-

    ¿A quién va dirigido?

    L

    Ingenieros, científicos y analistas de datos que buscan convertir grandes volúmenes de datos en información procesable.

    L

    Profesionales que quieran obtener herramientas de procesamiento de datos para mejorar procesos de toma de decisiones.

    L

    Profesionales que deseen aplicar técnicas de inteligencia artificial y machine learning para minar datos y realizar modelos descriptivos y predictivos.

    Plan de estudios

    CURSO DE NIVELACIÓN

    Conceptos básicos de Base de Datos y SQL.

    DATA WAREHOUSING

    Contenidos mínimos: Modelos de datos. Arquitecturas. Análisis de
    requerimientos. Diseño conceptual, lógico y físico. El modelo multidimensional:
    estrella, snowlflake y constellation. Manejo de cambios: Slowly changing
    dimensions. Diseño físico. Online Analytical Processing: OLAP. OLAP vd OLTP.
    SQL/OLAP: funciones de ventana.

    Profesor: Dr. Alejandro Vaisman.

    INTELIGENCIA ARTIFICIAL Y MACHINE LEARNING

    Contenidos mínimos. Conceptos básicos de Machine Learning. Modelos descriptivos y predictivos. Técnicas fundamentales: clasificación, clustering, patrones. Árboles de decisión. Aplicación a problemas concretos de predicción. Casos de estudio. Redes neuronales.

    Profesora: Dra. Marcela Riccillo.

    SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y BASES DE DATOS DE GRAFOS

    Contenidos mínimos. Parte 1: Bases de datos espaciales. Open Geospatial
    Consortium (OGC): objetos geométricos y geográficos. Lenguaje de Consulta:
    funciones y predicados para el análisis espacial. Concepto de índice espacial.
    Visualización de resultados en QGIS y OpenJump.

    Bases de datos de grafos NoSQL. Modelado de Property Graphs.
    Lenguaje de Consulta: búsqueda de patrones y uso de agregaciones. Soporte
    para el análisis de datos espaciales.

    Profesora: Dra. Leticia Gómez.

    VISUALIZACIÓN DE LA INFORMACIÓN

    Introducción, definiciones, antecedentes, gráficos notables. Principios de la excelencia gráfica. Observaciones y variables, tipos de variables y niveles de medición. Visualizando tablas, jerarquías y redes. Utilización del color. Reducción de dimensiones y visualización de grandes volúmenes de datos. Prácticas con Tableau, Observable, Python y R.

    Profesor: Lic. Ariel Aizemberg.

    Conocé al coordinador académico

    Alejandro Vaisman

    Alejandro es Doctor en Ciencias de la Computación por la Universidad de Buenos Aires. Postdoctorado en la Universidad de Toronto, Canadá. Es especialista en Data Warehousing y Business Intelligence (BI), Data Mining, Sistemas de Información Geográfica (GIS), y en publicación de datos en la web, siguiendo los lineamientos de Linked Open Data. Co-autor, junto con el Prof. Esteban Zimányi (Universidad Libre de Bruselas) del libro “Data Warehouse Systems: Design and Implementation”. Ha publicado, además, 5 capítulos en libros internacionales y ha publicado artículos en las más prestigiosas revistas y conferencias de la especialidad.

    Para recibir más información, contactanos a través del formulario de consulta