La filtración más amplia de archivos de paraísos fiscales en la historia revela las tenencias secretas en el extranjero de más de 300 políticos y funcionarios públicos de más de 90 países y territorios en los Pandora Papers.
¿En qué forma vinieron los datos en los documentos?
Los más de 11,9 millones de registros no estaban estructurados en gran medida. Más de la mitad de los archivos (6,4 millones) eran documentos de texto, incluidos más de 4 millones de archivos PDF, algunos de los cuales ocupaban más de 10.000 páginas. Los documentos incluían pasaportes, extractos bancarios, declaraciones de impuestos, registros de constitución de empresas, contratos inmobiliarios y cuestionarios de diligencia debida. También había más de 4,1 millones de imágenes y correos electrónicos en la filtración. Las hojas de cálculo constituían el 4% de los documentos, o más de 467.000. Los registros también incluían presentaciones de diapositivas y archivos de audio y video.
"Los datos son importantes", sí, pero la parte realmente importante es la información, el conocimiento extraído de los datos, no los datos en sí.
¿Puede un documento de 10 páginas contener más información que un documento de 100 páginas? No podemos decirlo sin antes haberlos leído por completo.
Una persona, de promedio necesita alrededor de 200 minutos / 3,5 horas para leer 100 páginas. ¿Qué pasa si tenemos miles de páginas de documentos legales o el análisis técnico de una inversión? ¿Hay alguna forma de gestionar la información esencial antes de leerlo todo? NO, y esto se vuelve cada vez más difícil a medida que aumentan el volumen y la variedad y, después de cierto punto, se vuelve imposible.
La solución de Data Discovery & Classification encuentra la información en los datos aportando mucha información antes de leer por completo el documento/s. A su vez, también es capaz de descubrir las conexiones entre archivos y documentos que tienen información en común. Solución basada en Inteligencia Artificial para Descubrir, Archivar y Proteger información sensible, personal o confidencial en orígenes de datos estructurados y no estructurados (Documentos de cualquier tipo, bases de datos y otras fuentes externas).
Cognitive Content Management
Gracias a las soluciones de Descubrimiento Semántico y la Clasificación Automática basadas en Inteligencia Artificial y Procesamiento del Lenguaje Natural, es posible la identificación de relaciones y la extracción y etiquetaje automatizado de nombres de personas, empresas, fechas, ubicaciones, y todos aquellos datos sensibles de los documentos, reduciendo muchas horas de trabajo manual en unos pocos segundos.
Mediante el uso de tecnologías de inteligencia artificial y procesamiento del lenguaje natural, es posible encontrar mucha información que no podría encontrar con búsquedas simples basadas en palabras. No es necesario que preclasifique los documentos ni que introduzca metadatos durante la indexación.
La gestión de contenido cognitivo permite entregar contenido muy personalizado y relevante.
Los datos generalmente vienen en una variedad de documentos y formatos, como PDF, Excel, redes sociales, correos electrónicos, documentos escaneados, fotografías o videos. Puede definir fuentes de datos o un nuevo documento con solo arrastrar y soltar, y el resto del procesamiento es automático.
La distribución geográfica del contenido tiene un valor incalculable.
Intelligent Search Engine with Mapping Features
Marcar / Realizar anotaciones es otro cuello de botella en un intento de descubrimiento manual. Supongamos que decidimos leer todos los documentos, pero ¿cómo marcamos las secciones importantes? Podemos tomar notas en un archivo de texto o utilizar la herramienta de comentarios de PDF (asumiendo que todos los archivos son PDF).
Bien, pero ¿cómo se hace un seguimiento de todos los comentarios?
Permite marcar y comentar sin importar el formato del contenido. Puede tomar notas en un archivo PDF o posiciones específicas en un proyecto DWG o un rango de tiempo en un video. Cuando el contenido de una nota coincide con la búsqueda, navega hasta la posición exacta. Las fechas, lugares y otra información extraída también se consideran marcas.
Hemos explicado todo en nuestro blog https://www.cobertic.com/lo-realmente-importante-es-la-informacion-el-conocimiento-extraido-de-los-datos-no-los-datos-en-si por lo que te animamos a echarle un vistazo y así descubrir por que puede ser una gran opción para tu compañía.
Y si os quedan dudas, estaremos encantados de atenderte en el 660 650 989 o por email info@cobertic.com
Llámanos, envíanos un email o rellena el formulario. ¡ Te responderemos lo más pronto posible !
Ofrecemos servicios y soluciones estratégicas. Con más de 25 años de actividad y la experiencia necesaria para ayudar a nuestros clientes a innovar y redefinir su estrategia digital.
Creemos en las relaciones a largo plazo por lo que nuestros valores se basan en el compromiso profesional, la transparencia y la claridad de las comunicaciones, el trato directo y el trabajo bien hecho.
Nuestra mayor satisfacción es la confianza de nuestros clientes.