Extracción de la Información. ¿Cómo funciona una herramienta de Monitorización Integral?

Responsable técnico BrandChats

Cada día nos sorprende encontrar más herramientas de monitorización de pago y gratuitas en el mercado, pero esto en vez de verlo como una amenaza más bien lo entendemos como una oportunidad para mejorar nuestra herramienta. Y vosotros os preguntaréis ¿hacemos copia de lo que va saliendo en el mercado? Y nuestra respuesta es NO.

Para entender mejor el mundo de las AP’is, Queries y estas claves tecnológicas contamos con nuestro Responsable Técnico estrella “Maxime Gosmant” al cual le haremos algunas preguntas para mostrar de forma transparente como funciona el corazón de BrandChats.

Maxime, cuéntanos:

¿De dónde se extrae la información que arroja BrandChats de los informes de Twitter? ¿ Usáis  las Api’s de Twitter directamente?

Sí, vamos a buscar la información directamente a la fuente, en Twitter. Twitter proporciona muchos métodos para buscar, filtrar y recuperar todos los datos públicos que se generan en su plataforma, sean los propios tweets o también la información de los usuarios (que han querido compartir).

¿Y de los Blogs? ¿Cómo sabéis que os han nombrado como Marca en diversos blogs?

Nos conectamos a varios agregadores de blogs para recuperar los artículos que mencionan nuestras marcas. El hecho de utilizar varios nos asegura no perder ningún artículo (o el mínimo posible). Luego el trabajo consiste en normalizar los artículos, eliminar los duplicados y enriquecerlos con datos de tráfico por ejemplo.

¿En las noticias y los foros monitorizais  por alguna api o proveedores en específico? ¿que os ofrecen ellos?

Del mismo modo que para los blogs siempre utilizamos varios agregadores especializados bien en noticias o bien en foros. Por ejemplo un agregador de noticias con amplia cobertura es Google News.

Suelen ofrecer una información básica sobre una noticia: la fecha de publicación, el autor, la fuente original y un extracto de la noticia. Nosotros para permitir un análisis más profundo añadimos el ranking de Alexa a cada fuente, por ejemplo.

Para obtener la información: ¿ debéis  pagar o los proveedores son gratuitos?

Los hay gratuitos y de pago. Existen también modelos “híbridos” donde no pagas nada hasta un cierto volumen recuperado, y luego empiezan a cobrar. Este modelo es interesante ya que te permite probar el servicio gratuitamente los primeros meses y cuando estás seguro que te conviene a ti y a tus clientes lo empiezas a pagar. En cualquier caso todos los proveedores limitan el volumen de noticias que podemos recuperar diariamente, aunque en algunos casos estos límites son altos (p.ej.: Twitter).

¿Es información especializada para empresas como la vuestra o también  tienen sus propias herramientas?

En general todos los proveedores de datos tienen su propia herramienta de visualización, aunque sea básica. Por ejemplo mencioné anteriormente el agregador Google News, ellos permiten leer los artículos directamente en su sitio web pero no permiten otra forma de visualización que no sea artículo por artículo. Twitter también tiene su propia herramienta, su sitio web, pero es tan básica que docenas de startups se han dedicado a crear otras más completas (Tweetdeck por ejemplo, que por cierto la acaba de comprar Twitter).

¿Como se generan los gráficos?

Los gráficos se generan con la herramienta que desee el cliente, o con la que ya tenga instalada en su empresa (tipo Reporting). Nosotros proporcionamos una herramienta para manipular nuestros datos llamada Visokio. Es especializada en temas de visualización y permite generar cualquier tipo de informe sin tener conocimientos avanzados o de programación, es su gran ventaja.

¿Puedo exportar los datos de BrandChats?

Nosotros queremos enfocar nuestro trabajo a la manipulación de datos y sobre todo a su integración en la empresa. No queremos que estos datos se mantengan en una herramienta web cerrada, queremos que se propaguen en toda la empresa: al departamento comercial, a marketing, a atención al cliente, etc… Por eso tenemos una plataforma abierta, centrada en la conexión de los datos con otros sistemas.

En el caso de la semántica para los comentarios positivos o negativos, ¿ utilizáis un servicio en especial, o vocabulario estándar?

Tenemos varios métodos. Por defecto utilizamos diccionarios estándares en varios idiomas para clasificar las noticias como positivas o negativas. Somos conscientes que este método tiene sus límites y por eso también utilizamos una herramienta especializada en la generación de diccionarios propios a cada marca, en cada idioma. Esta herramienta utiliza métodos estadísticos de clasificación y aunque la primera vez necesite una buena revisión manual vale la pena realizarla ya que elabora diccionarios mucho más precisos.

 

Leave a Reply

You must be logged in to post a comment.

© 2011 Brandchats Watch Your Brand, www.brandchats.com, TELÉFONO: +34 93 785 69 67 brandchats@tinval.com