Programa del Curso
Sección 1: Introducción a Big Data / NoSQL
NoSQL visión general
Teorema CAP
¿Cuándo es apropiado el número 4]
Almacenamiento en columnas
NoSQL ecosistema
Sección 2 : Cassandra Conceptos básicos
Diseño y arquitectura
Cassandra Nodos, clústeres, centros de datos
Espacios de claves, tablas, filas y columnas
Particionamiento, replicación, tokens
Niveles de quórum y coherencia
Labs: interacción con cassandra mediante CQLSH
Sección 3: Modelado de datos – parte 1
Introducción a CQL
Tipos de datos CQL
Creación de espacios de claves y tablas
Elección de columnas y tipos
Elección de claves primarias
Diseño de datos para filas y columnas
Tiempo de vida (TTL)
Consulta con CQL
Actualizaciones de CQL
Colecciones (lista / mapa / conjunto)
Laboratorios: varios ejercicios de modelado de datos utilizando CQL; Experimentar con consultas y tipos de datos admitidos
Sección 4: Modelado de datos – parte 2
Creación y uso de índices secundarios
Claves compuestas (claves de partición y claves de agrupación en clústeres)
Datos de series temporales
Prácticas recomendadas para datos de series temporales
Contadores
Transacciones ligeras (LWT)
Labs: creación y uso de índices; Modelado de datos de series temporales
Sección 5 : Laboratorios de modelado de datos : Sesión de diseño grupal
Se presentan múltiples casos de uso de varios dominios
Los estudiantes trabajan en grupos para crear diseños y modelos
Discutir varios diseños, analizar decisiones
Laboratorio : implementar uno de los escenarios
Sección 6: Conductores de Cassandra
Introducción al controlador Java
Operaciones CRUD (Crear/Leer/Actualizar, Eliminar) mediante el cliente Java
Consultas asincrónicas
Labs: uso de la API Java para Cassandra
Sección 7 : Cassandra Componentes internos
Comprender Cassandra el diseño bajo el capó
sstables, memtables, registro de confirmaciones
Ruta de lectura / Ruta de escritura
Caché
vnodes
Sección 8: Administración
Selección de hardware
Cassandra Distribuciones
Instalación Cassandra
Ejecución de puntos de referencia
Herramientas para supervisar el rendimiento y las actividades de los nodos
DataStax OpsCenter
Diagnóstico Cassandra de problemas de rendimiento
Investigación de un bloqueo de nodo
Descripción de la reparación, eliminación y replicación de datos
Otras herramientas y consejos para la solución de problemas
Cassandra Mejores prácticas (compactación, recolección de basura,)
Sección 9: Laboratorio de bonificación (si el tiempo lo permite)
Implemente un servicio de música como Pandora / Spotify en Cassandra
Requerimientos
- cómodo con el lenguaje de programación Java
- Cómodo en el entorno Linux (navegando por la línea de comandos, editando archivos con VI / Nano)
Entorno de laboratorio:
Se proporcionará un entorno de trabajo Cassandra para los estudiantes. Los estudiantes necesitarían un cliente SSH y un navegador para acceder al clúster.
Instalación cero: ¡No es necesario instalar Cassandra en las máquinas de los estudiantes!