Logo Projor Conheça outros projetos

Mosaico

Mosaico es una biblioteca Python creada por Folha de S.Paulo y diseñada para crear y gestionar composiciones de vídeo de forma programática. La herramienta permite que los periodistas transformen rápidamente narrativas textuales en vídeos cortos, utilizando inteligencia artificial como apoyo en el proceso.

Así funciona

Construida sobre MoviePy, una de las bibliotecas de edición de vídeo más populares en Python, Mosaico ofrece una interfaz de alto nivel para trabajar con activos de medios, posicionar elementos, aplicar efectos y generar guiones de vídeo. Con un enfoque en la flexibilidad y la extensibilidad, la biblioteca proporciona abstracciones limpias para gestionar diferentes tipos de medios, controlar el posicionamiento y el diseño, aplicar efectos y animaciones, además de integrar características avanzadas como la generación de guiones basada en IA, la síntesis de texto a voz e integración con marcos populares de aprendizaje automático. Sus principales características incluyen la generación de guiones, la gestión de activos, un sistema de posicionamiento preciso, motor de efectos, síntesis de voz e integraciones externas, lo que la convierte en una herramienta poderosa y versátil para la creación de vídeos de manera programática.

Documentación

La arquitectura de Mosaico está estructurada en componentes modulares que interactúan para crear composiciones de vídeo complejas. El Sistema de Referencia de Activos gestiona los recursos en proyectos a gran escala, mientras que el Motor de Posicionamiento ofrece modos absoluto, relativo y basado en regiones, realizando cálculos conscientes de los cuadros.

El Motor de Efectos presenta efectos integrados y un sistema extensible para la creación de efectos personalizados, soportando configuración basada en parámetros y composición para animaciones complejas. Las integraciones de Mosaico incluyen Haystack para el procesamiento de documentos y generación de guiones, LangChain para flujos de trabajo de IA, y servicios de voz y transcripción como OpenAI, ElevenLabs y AssemblyAI.

La generación de guiones proporciona interfaces para la creación personalizada y un marco para la integración de IA, organizando tomas y escenas para la renderización directa del guion a vídeo. La gestión de proyectos incluye la configuración de proyectos de vídeo y la gestión de la línea de tiempo.

La personalización y extensibilidad son características clave de Mosaico, diseñado con una arquitectura modular que permite la extensión de funcionalidades. La biblioteca incluye un sistema de adaptadores para integraciones externas y protocolos de integración definidos.

En términos de rendimiento, Mosaico implementa técnicas de gestión de memoria y procesamiento paralelo para manejar proyectos a gran escala.

Los requisitos técnicos de Mosaico incluyen Python 3.7 o superior, además de dependencias como MoviePy, NumPy y Pillow. Dependencias opcionales pueden ser necesarias para integraciones específicas. Esta estructura técnica convierte a Mosaico en una herramienta para desarrolladores e ingenieros de software interesados en crear soluciones de composición de vídeo programática.

Para saber más, visita el repositorio en Github y consulta la documentación del proyecto.

Imágenes ilustrativas