En un artículo anterior expliqué por qué Google pagó casi dos millones de dólares a la Universidad de Stanford. También conté el origen de Google, basado en un algoritmo que se encargaba de ordenar los enlaces web según si eran más o menos citados en otras páginas web. El proceso era automático y revolucionó internet tal y como la conocemos.

Conocido como PageRank, este algoritmo protagonizó el artículo académico que escribieron Sergey Brin y Larry Page. Y no solo les ayudó a lograr su doctorado en Ciencias de la Computación por la Universidad de Stanford, también les sirvió para crear su propia startup y hacerse millonarios, algo que llegará más pronto que tarde.

Sin embargo, hay retazos de esta historia que son poco conocidos. Uno de ellos también lo traté en forma de artículo titulado cuál es la historia del tercer fundador de Google, donde explico que la primera versión de Google, llamada BackRub, se instaló en ordenadores de la propia Universidad de Stanford con la ayuda de nombres que hoy son prácticamente anónimos, como Scott Hassan o Alan Steremberg.

Otro detalle es que Google y Baidu, los dos buscadores más populares del mundo, tienen un origen mucho más estrecho de lo que nos podría parecer. Y es que aunque Google nace antes que Baidu, su algoritmo está inspirado en el algoritmo de Baidu. Pero vayamos por partes.

Un historia paralela

Baidu es el buscador de internet más popular de China. Según el índice Alexa, con fecha de abril de 2020, Baidu es la quinta página más visitada en todo el mundo. La primera es Google, seguida de YouTube. En cuanto a buscadores, Google y Baidu son los primeros. Y en cuanto a páginas chinas más visitadas, Baidu solo es superada por Tmall, una tienda online.

No pasa nada si no conoces Baidu. Su área de influencia es China. Y aunque cuenta con una versión japonesa, quién sabe si en el futuro tendrá versiones en otros idiomas. Por el momento, sólo está disponible en chino y japonés. Pero sus cifras son tan impresionantes como las de Google.

En 2017 tenía 665 millones de usuarios activos mensuales sólo en dispositivos móviles y sus aplicaciones eran utilizadas diariamente por más de 200 millones de usuarios en 2019. En porcentaje de uso, en China, Baidu representaba en 2019 el 79% de búsquedas móviles y 43% de búsquedas desde escritorio.

Por lo demás, ofrece multitud de servicios, además de la búsqueda, como mapas, almacenamiento online, portal de noticias, búsqueda de música en MP3, foro de consultas, búsquedas de imágenes y vídeos. También tiene su propia tienda online, software para escritorio y dispositivos móviles e incluso tiene su propia enciclopedia online.

Pero vayamos a sus inicios. Baidu nace un 18 de enero de 2000. Sus fundadores son Robin Li y Eric Xu. Y al igual que Google se basa en un algoritmo de nombre PageRank, el buscador conocido como Baidu nace también basado en su propio algoritmo, de nombre RankDex, y cuyo creador es el propio Robin Li.

Robin Li y el origen de RankDex

Robin Li Yanhong es en la actualidad una de las personas más ricas de China. Según Wikipedia, en la actualidad cuenta con más de 6.000 millones de dólares estadounidenses. En lo personal, está casado y tiene cuatro hijos. Pero nos interesa más su etapa de formación.

Li estudió en la Universidad de Pekín, pero en 1991 dio el salto a Estados Unidos para cursar estudios en la Universidad de Búfalo. En concreto, quería doctorarse en ciencias de la computación. Sin embargo, no terminó su doctorado. Su titulación se quedó en máster.

El motivo principal de abandonar sus estudios fue la oportunidad laboral. Nada más y nada menos que desarrollar un software para la edición online del Wall Street Journal, uno de los medios de comunicación más importantes del mundo. Su labor duró entre 1994 y 1997 en las instalaciones de la empresa IDD Information Services, con sede en Nueva Jersey.

Y gracias a ese trabajo desarrollando software, Robin Li da con un algoritmo, RankDex. Gracias a este algoritmo podrá indexar documentos y enlaces. ¿Os suena de algo? El algoritmo como tal nace en 1996 y la patente será aprobada en 1997. Al mismo tiempo, en 1996 se ponía en marcha BackRub, antecesor casero de Google. Volviendo a RankDex, a nombre de Yanhong Li, se trata de la patente US5920859A y que podéis consultar aquí, curiosamente, gracias a Google.

La relación entre Baidu y Google

Decía que RankDex recibió la patente en Estados Unidos en 1997. Pues bien. PageRank, el algoritmo propuesto por los fundadores de Google, Sergey Brin y Larry Page, será patentado en 1998. La patente US6285999B1, a nombre de Lawrence Page, y que podéis consultar aquí, es similar a la presentada por Li un año antes.

Obviamente, si fueran idénticas, no hubieran sido aprobadas por la Oficina de Patentes y Marcas Registradas de Estados Unidos. Pero solo en su descripción vemos muchas similitudes. Mientras que Li habla de herramienta de búsqueda, Page habla en genérico de método. En ambos casos se trata de indexar contenido, principalmente enlaces, y jerarquizarlos según su valor.

La pregunta que podemos hacernos es, ¿casualidad? ¿Conocían Brin y Page el algoritmo de Li? Todo apunta a que sí. Más que nada porque en la propia patente de 1998 sobre PageRank se menciona la patente anterior de Li. Si consultas la patenta de PageRank, una simple búsqueda dentro de la propia página nos devuelve resultados como citar el algoritmo de Li de manera indirecta.

En concreto, el párrafo dice “Hyperlink Search Engine, developed by IDD Information Services, (http://rankdex.gari.com/) uses backlink information (i.e., information from pages that contain links to the current page) to assist in identifying relevant web documents”. La cita menciona el algoritmo de Li a través de su enlace y del nombre de la empresa en la que trabajaba cuando creó el algoritmo, IDD Information Services.

Pero hay más. Al final del documento vemos las patentes citadas. Y entre las 28 incluidas en la lista, aparece la patente US5920859A de 1997 a nombre de Robin Li Yanhong, el fundador de Baidu.

El resto de la historia ya la hemos mencionado antes. El dominio Google se registró en septiembre de 1997, antes de que la patente del algoritmo PageRank fuera aprobada. La empresa como tal nace un año después. A finales de 1998, ya tenían 60 millones de páginas indexadas, todo ello en fase Beta. Baidu, por su parte, no llegará hasta 2000.