Caso de éxito

Desmaquetación automática de prensa escrita en Rebold

Rebold es una empresa española del sector del marketing y de la comunicación que se ha especializado en el análisis de datos de interés para sus clientes. Mediante el conocimiento completo de su entorno, los clientes de Rebold podrán identificar oportunidades de crecimiento. Entre la información a estudiar, se encuentra la presente en la prensa escrita.

01. Reto

Uno de los trabajos más laboriosos para el análisis de prensa es la desmaquetación de la misma, identificando en cada medio las diferentes unidades informativas.

Esta desmaquetación se realiza de forma manual por parte de diversos operarios, que visualizan cientos de páginas de diversos medios y recortaban digitalmente dichas páginas en diversas noticias. Este es un trabajo necesario, pero que aporta poco valor en sí mismo si no hacemos un posterior análisis de la noticia.

La realización de esta desmaquetación es altamente costosa en tiempo. Además, en un entorno donde cada vez las noticias son más cambiantes y efímeras, se hace necesario disponer de un sistema donde este proceso sea muchísimo más rápido.

En Rebold buscaban expertos en inteligencia artificial y visión por computador. Estos debían ser capaces de identificar, clusterizar y agrupar un conjunto de cuadros de textos de diversas formas y tamaños en una unidad informativa.

Datision dispone de amplia experiencia en visión por computador y, como Spin-off del Institut de Robòtica i Informàtica industrial (IRI), había participado en múltiples proyectos de investigación que podían ayudar a conseguir los objetivos marcados.

02. Solución

Para resolver el problema planteado, se decide desarrollar un sistema basado en deep learning. Éste será capaz de aprender de forma autónoma el actual proceso de desmaquetación, lo cual es posible gracias al gran corpus de datos actual disponible.

Mediante el uso de estos algoritmos, el sistema es capaz de generar imágenes de los diversos medios de comunicación, establecer correlaciones entre los diversos cuadros de texto debido a su posición, tipografía, tamaño, etc, y determinar cuáles de ellos, incluidos imágenes, forman parte de una misma noticia.

Sin duda este sistema supone un aumento de la productividad de los operarios en el proceso de desmaquetación, que podrán centrarse en el análisis de la noticia aumentando así el valor de su trabajo y reduciendo el tiempo de análisis.

03. En la actualidad

Este proyecto de investigación se encuentra en su fase final y con resultado satisfactorio para su puesta en producción en breve. Se han pasado de tiempos de desmaquetado manual de 20-30 minutos a sólo segundos. 

Una vez finalizado, se espera continuar avanzado en la clasificación y análisis del texto mediante el uso de sistemas de procesamiento de lenguaje natural.

Nuestros casos de éxito

Cashkeeper

Mantenimiento predictivo de equipos de cash handling en CashKeeper.

Endesa

Gestión y optimización de costes de proyectos de telecomunicaciones en Endesa.

Rebold

Desmaquetación automática de prensa escrita en Rebold.

Comforsa

Mantenimiento predictivo e identificación precoz de defectología en forja pesada en Comforsa.

Importante empresa de curtido de pieles

Identificación de defectos en piel natural.

Flamagas

Identificación de errores estéticos de serigrafiado en Flamagas.

Fabricante de ascensores

Predicción de uso de ascensores.

¿Quieres ser el próximo?

Descubre todos los secretos para lograr reducir al mínimo la merma en tu fábrica con esta lista de verificación gratuita

Descarga tu checklist