Montevideo, Uruguay · Audio AI · Machine Listening · MIR

Gabriel Bibbó

Ingeniero de investigación en Audio AI

Construyo sistemas de machine learning de audio que funcionan fuera del notebook, en detección de eventos sonoros, detección de actividad de voz, audio que preserva la privacidad y recuperación de información musical. Cuatro años escribiendo C/C++ embebido para productos de Bang & Olufsen me enseñaron la distancia entre un prototipo y un dispositivo que llega a producción. También soy DJ y productor, y buena parte de mi interés por cómo escuchan las máquinas nació de cómo escucho yo.

Proyectos

Sistemas de investigación, datasets, demos y herramientas de tecnología musical.

Primero el trabajo revisado por pares; después sistemas independientes y proyectos técnicos personales.

Audio AI · VAD · Evaluación de modelos

2025-2026

Audio-Language Models for Voice Activity Detection

Esta investigación evalúa cómo los audio-language models detectan habla cuando el audio es corto, ruidoso, reverberante o filtrado. El proyecto compara Qwen2-Audio-7B, Qwen2-Audio-7B con LoRA, Qwen3-Omni-30B y Silero VAD sobre el mismo banco de pruebas degradadas. El mejor resultado fue Qwen2-Audio-7B con LoRA y OPRO-Template: 93,3% de balanced accuracy sobre 21.340 clips degradados.

VADQwenLoRAOPROSileroPyTorch

Dataset con privacidad · Audio doméstico

2024

Sounds of Home Dataset

Sounds of Home es un dataset residencial para sound event detection. Contiene 1.344 grabaciones de una hora tomadas en 8 hogares de Bélgica, con grabadoras AudioMoth colocadas en salas de estar y cocinas. El habla fue removida antes de la publicación y se incluyeron predicciones de PANNs para los frames de audio.

SEDPrivacidadAudioMothPANNsDatasets

Privacidad · Remoción de habla · WASPAA

2025

Speech Removal Framework

Framework para remover habla de grabaciones de audio antes de compartirlas o publicarlas. El sistema permite flujos de publicación de audio que preservan la privacidad, manteniendo información acústica no verbal útil para investigación en sound event detection.

Remoción de hablaPrivacidadWASPAA

MIR · Mezcla armónica · Tesis MSc

2021-2022

Harmonic EDM Mixing Compatibility

Este sistema de análisis musical estima qué tan bien pueden mezclarse armónicamente dos tracks de EDM. Analiza tracks, calcula chroma features, los convierte en Tonal Interval Vectors, compara compatibilidad armónica y sugiere transposiciones que pueden mejorar una mezcla. El trabajo comenzó como tesis de MSc y luego se publicó en ICWE 2022.

MIREDMChromaTIVEssentialibrosa

Speech enhancement · Plataforma backend

2026

ASR Enhancement Platform

ASR Enhancement Platform compara dos caminos de reconocimiento de voz sobre el mismo audio: transcripción cruda y enhance-and-transcribe. El backend guarda jobs, archivos de audio, transcripciones y payloads de proveedores para poder inspeccionar cada resultado. Usa FastAPI, Celery, PostgreSQL, Redis, MinIO, Docker Compose, métricas, tracing, Grafana y CI.

ASRFastAPICeleryDockerPostgreSQLRedis

MIR · Organización de librería DJ

2026

Traktor ML

Traktor ML convierte una librería local de Techno y Tech House en playlists listas para Traktor. El pipeline extrae embeddings MERT, separa stems con Demucs, lee BPM y tonalidad con Essentia, agrupa tracks similares, los ordena para transiciones más suaves y exporta playlists M3U. La corrida V4 procesó 239 tracks y exportó 14 playlists. La colección privada de audio no está incluida en el repositorio.

MERTDemucsEssentiaHDBSCANUMAPStreamlit

ALPACA

2026

Plataforma de trading algorítmico en Python con ingesta de datos de mercado, controles de riesgo, backtesting y monitoreo en tiempo real.

PythonBacktestingMonitoreo

Raspberry Pi Sound Event Recognition Demo

2023

Demo en Raspberry Pi para reconocimiento de eventos sonoros en tiempo real. El sistema ejecuta redes neuronales preentrenadas en un dispositivo edge de bajo costo, expone una interfaz web y puede enviar notificaciones por email cuando detecta eventos seleccionados de AudioSet.

Raspberry PiAI edgeAudioSet

3H-ATO

2020

Herramienta mecánica diseñada durante la pandemia para evitar tocar directamente superficies compartidas. Es un proyecto de prototipado físico, no un proyecto de AI.

Diseño de productoPrototipado

Automatic IoT Soap Dispenser

2020

Dispositivo IoT de higiene de manos para entornos industriales. Usaba acero inoxidable, WiFi, conectividad cloud, sensores IR/RFID y un tanque de 3 litros.

IoTSensoresHigiene industrial

UyVoy Mobile App

2020

Proyecto de app móvil para reservar turnos y reducir aglomeraciones durante la pandemia. Mi rol figura como Project Manager.

App móvilTecnología cívicaGestión de proyectos

Investigación / Publicaciones

Publicaciones y trabajos, ordenados por año.

2025

Privacy for Audio AI: Risks, Challenges, and Emerging Solutions in the Era of Audio AI [Panel discussion]

Thomas Deacon; Jennifer Williams; Jason R. C. Nurse; Christopher Hicks; Gabriel Bibbó; Arshdeep Singh; Mark D. Plumbley

2025 AES International Conference on Artificial Intelligence and Machine Learning for Audio

Speech Removal Framework for Privacy-preserving Audio Recordings

Gabriel Bibbó; Arshdeep Singh; Mark D. Plumbley

2025 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Tahoe City, CA, October 2025

Room Acoustics and Microphone Characteristics Show Systematic Impact on Sound Event Recognition

Gabriel Bibbó; Craig Cieciura; Mark D. Plumbley

Proceedings of the 54th International Congress and Exposition on Noise Control Engineering, São Paulo, Brazil, August 2025

Integrating IP broadcasting with audio tags: Workflow and challenges

Rhys Burchett-Vass; Arshdeep Singh; Gabriel Bibbó; Mark D. Plumbley

2025 AES International Conference on Artificial Intelligence and Machine Learning for Audio

Soundscape Experience Mapping: A Deep Listening Approach for Eliciting Older Adults' Perceptions of Indoor Soundscapes

Thomas Deacon; Gabriel Bibbó; Arshdeep Singh; Mark D. Plumbley

Forum Acusticum / Euronoise 2025, Málaga, Spain, June 2025

Personalized Live Sound Recognition Using Efficient PANNs [Show and Tell]

Arshdeep Singh; Gabriel Bibbó; Thomas Deacon; Haohe Liu; Mark D. Plumbley

IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2025), Hyderabad, India, April 2025

2024

Environmental sound classification on an embedded hardware platform

Gabriel Bibbó; Arshdeep Singh; Mark D. Plumbley

INTER-NOISE and NOISE-CON Congress and Conference Proceedings, Nantes, France, August 2024

The Sounds of Home: A Speech-Removed Residential Audio Dataset for Sound Event Detection

Gabriel Bibbó; Thomas Deacon; Arshdeep Singh; Mark D. Plumbley

8th International Workshop on Speech Processing in Everyday Environments (CHiME 2024), Kos Island, Greece, September 2024

Soundscape Personalisation at Work: Designing AI-Enabled Sound Technologies for the Workplace

Thomas Deacon; Gabriel Bibbó; Arshdeep Singh; Mark D. Plumbley

International Conference on Sound and Music Computing (SMC 2024), Porto, Portugal, July 2024

2023

Recognise and Notify Sound Events Using a Raspberry PI Based Standalone Device [Demo]

Gabriel Bibbó; Arshdeep Singh; Mark D. Plumbley

IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2023), New York, U.S.A, October 2023

2022

A New Compatibility Measure for Harmonic EDM Mixing

Gabriel Bibbó; Ángel Faraldo

International Conference on Web Engineering (ICWE 2022), Bari, Italy, July 2022

2021

Towards a New Compatibility Measure for Harmonic EDM Mixing

Gabriel Bibbó

Tesis de máster, Universitat Pompeu Fabra, Barcelona, España, 2021. Tutor: Ángel Faraldo.

2017

Autonomous Mobile Robots Comunicated by Software Defined Radio

Gabriel Bibbó; Mariana Gelós; Martín Randall; Pablo Belzarena; Federico Larroca

Tesis de grado, Universidad de la República, Montevideo, Uruguay, 2017.

Experiencia

Experiencia laboral.

Dic.2025-Presente
University of Surrey logo

Visiting Researcher (collaboration)

University of Surrey, Remoto

  • Preparación de un artículo para IEEE/ACM TASLP con Mark D. Plumbley y Simone Spagnol (Università Iuav di Venezia) sobre VAD con la familia Qwen-Audio bajo degradaciones psicoacústicas, usando PEFT/LoRA, optimización de prompts con OPRO, cuantización 4-bit NF4 y evaluación contra un baseline congelado de Qwen3-Omni.
  • Coautoría de un artículo para IEEE Signal Processing Magazine con Arshdeep Singh (King’s College London) sobre audio que preserva la privacidad y machine listening.
Nov.2022-Nov.2025
University of Surrey logo

Research Engineer in Sound Sensing

University of Surrey, Guildford, UK

  • Desarrollo de sistemas end-to-end de audio ML para entornos inteligentes reales, cubriendo preparación de datos, evaluación de modelos, despliegue de prototipos, releases open-source, demos, datasets y documentación técnica para assisted living, smart buildings y monitoreo de sonido urbano.
  • Construcción de pipelines de SED con preservación de privacidad para grabaciones sensibles en hogares, incluyendo un dataset residencial de 197 GB, workflows de remoción de habla y recursos reproducibles de evaluación.
  • Diseño de pipelines VAD basados en Slurm para comparar 8 modelos bajo degradaciones acústicas controladas, con análisis de robustez y comparación estadística entre familias de modelos.
  • Despliegue de inferencia CNN en tiempo real en Raspberry Pi, incluyendo cuantización, perfilado térmico, evaluación de consumo y documentación de edge sound sensing.
  • Publicación y presentación de investigación en IEEE WASPAA, CHiME Workshop, ICWE, Inter-Noise, SMC, UKAI, UKIS y AES. Supervisión de proyectos de grado y máster.
Mar.2022-Nov.2022
Google logo

Technical Support Engineer - Google Workspace

Webhelp, Barcelona, España

  • Soporte Tier 3 para clientes enterprise de Google Workspace en APIs, OAuth, SAML/SSO, IAM, aprovisionamiento de usuarios, migración de datos, configuración DNS/dominios y ajustes de seguridad/compliance.
Nov.2021-Mar.2022
KPMG logo

IT Auditor

KPMG, Barcelona, España

  • Soporte a empresas de telecomunicaciones y departamentos de IT en servicios de auditoría.
Abr.2016-Dic.2019
Ikatu logo

R&D Engineer

Ikatu, Montevideo, Uruguay

  • Diseño y entrega de firmware de audio e IoT en C/C++ embebido para productos de automatización del hogar de Bang & Olufsen: drivers de bajo nivel, integración de hardware, audio I/O y conectividad a Internet.
  • Trabajo sobre el ciclo de vida del producto: requerimientos, arquitectura, implementación, testing, validación y documentación orientada a cliente.
  • Capacitación e incorporación de nuevos programadores en prácticas de desarrollo embebido.

Formación académica

Estudios formales.

2020-2021

MSc Sound and Music Computing

Universitat Pompeu Fabra, Barcelona, España

Tesis de máster sobre compatibilidad armónica para mezcla EDM. Calificación final de tesis: 9/10.

2010-2017

BSc Electrical Engineering

Universidad de la República, Montevideo, Uruguay

Tesis de grado sobre robots móviles autónomos comunicados mediante software-defined radio.

Stack técnico

Herramientas y métodos usados en investigación, software, audio y despliegue.

Stack

PythonC/C++PyTorchHugging FacePEFTTorchAudiolibrosaEssentiascikit-learnpandasNumPySciPyFlaskStreamlitHugging Face SpacesDockerGitLinux CLIBashSlurmRedis StreamsPrometheusGrafanaSQLiteMATLABClaude Code / VS Code

ML

CNNsTransformersAudio-Language ModelsLoRA Fine-tuning4-bit QuantizationAprendizaje supervisado y self-supervisedPipelines de evaluaciónTesting estadísticoDespliegue edge

Audio

Detección de eventos sonorosDetección de actividad de vozRecuperación de información musicalProcesamiento digital de señalesAudio en tiempo realDAWsAbletonDJingProducción de música electrónica

Práctica

Pipelines ML reproduciblesCuraduría de datasetsDesarrollo open-sourcePrácticas MLOpsDesarrollo asistido por AIEscritura técnicaColaboración interdisciplinaria

Información adicional

Idiomas, certificaciones, membresías y grants.

Idiomas

Español — NativoInglés — C1Portugués — A2

Certificaciones

PRINCE2 FoundationDeep Learning SpecializationMachine Learning — Stanford / Coursera

Música y membresías

Escuela de música: Virgilio Scarabelli AlbertiMiembro de IEEE Signal Processing Society

Grants de investigación

Participante en EPSRC AI for Sound

Contacto

Hablemos.

Ciudadano italiano con autorización de trabajo en la UE. Abierto a roles remotos en LATAM/Europa y a oportunidades seleccionadas de relocalización dentro de la UE.

Email: gabobibbo@gmail.com