Los buscadores en línea son un negocio, no por los anuncios que nos enseñan o los resultados promocionados, que suponen más bien poco porcentaje sobre sus ganancias. El valor real de ser el buscador más usado en un ámbito es la recolección de datos. Pero ¿cuánto cuestan esos datos?
Es casi de sentido común saber que las búsquedas móviles están incrementando dramáticamente en los últimos años, y Google se lleva la palma en ellas, ya que es el buscador predeterminado en Android y iOS; tiene clientela asegurada. Al tener clientes seguros, tiene otra cosa segura: un flujo de datos de esos usuarios constante, de uso, de localización, incluso de gustos con un poco de minería de datos.
Bing, el buscador de Microsoft, no tiene estos datos, ya que, aunque la calidad de sus servicios es mayor que la de Google en ocasiones, el gigante de Mountain View está tan metido dentro de nuestra cultura ("déjame que googlee eso"), que los usuarios no ven otras alternativas. Desde hace 3 años que salió al mercado, Bing no le ha arrancado demasiado mercado a Google (tiene el 16% del mercado estadounidense, según ComScore), aún teniendo en cuenta que gastó una real millonada en investigación de inteligencia artificial (una variación de la misma, realmente, enfocada a la minería de datos) para que las máquinas pudieran aprender de las búsquedas.
La cuestión es que ni Bing, ni Yahoo! (que es tiene el 13% del mercado en USA) son usados en móviles, a duras penas, desaprovechando toda la infraestructura que tiene Microsoft para recolectar datos, que según ellos mismos:
No sabemos lo que hay en Google, pero nosotros podríamos tener la mayor máquina que aprende del mundo.
Desde Microsoft esperan cubrir esta carencia en el mercado móvil con Windows Phone 8, una buena implantación de Surface y la integración de las mismas con las redes sociales. Otro punto de partida es recolectar datos de Skype y usarlos en los servicios de Microsoft.
El problema es que esta forma de conseguir datos de manera indirecta tiene un coste altísimo computacional. Por ejemplo, el hecho de que Bing tenga más de 3600 formas de escribir incorrectamente "Arnold Schwarzenegger" hacen que la calidad de los resultados frente a los de Google sea mucho más alta, pero a un coste de cómputo bastante más alto también, ya que el usuario sólo ve los resultados más significativos o que más tengan que ver con el entorno del usuario (de ahí que necesiten recolectar datos sobre él).
Está claro que las búsquedas son críticas para nuestro futuro. (...). Es una forma de hacer más potentes todos nuestros productos.