– Oct 26, 2019, 12:30 (CET)

30 años de ZIP: el estándar de la compresión

Cuando Phil Katz creó el formato de compresión ZIP nadie podía imaginar que acabaría por desbancar cualquier otro formato y se iba a integrar en la mayoría de sistemas operativos. No era el mejor pero sí lograba comprimir toda clase de archivos sin pérdida de datos, algo complicado en aquel entonces. Y en contra de lo que pueda parecer, el formato ZIP está más vivo que nunca, ya que es la base de los documentos Office Open XML de Microsoft Office, OpenDocument y las apps ofimáticas de Apple.

Prácticamente todo el mundo se ha encontrado alguna vez con un archivo ZIP. Aunque se utiliza menos como medio para enviar archivos de gran tamaño, se sigue usando para guardar con contraseña archivos importantes o para compartir dos o más ficheros empaquetados en uno solo. Con todo, pocos pueden imaginar que el nacimiento de este formato se debe a una disputa legal y su propio creador, Phil Katz, seguramente no pensaría que tendría tanto éxito que se convertiría en un estándar, soportado por los sistemas operativos y que incluso acabaría siendo la base de los documentos ofimáticos actuales y de los libros electrónicos.

El formato ZIP no es el mejor de su clase, pero sí cumple bien su función, es fácil de usar, muy rápido y se puede abrir con cualquier programa gracias que su creador lo puso a disposición del dominio público frente a otros formatos con licencia comercial. Además, nació en un momento en el que el espacio disponible era limitado y comprimir archivos era la única manera de transportarlos y almacenarlos.

Su popularidad lo convertiría en el candidato ideal para formar parte de los estándares de la ofimática OpenDocument, Office Open XML y ePub donde se combinan archivos XML empaquetados dentro de un ZIP transparente para el usuario. No es fácil que un formato con 30 años de vida consiga reconvertirse y seguir más vivo que nunca después de tanto tiempo.

SEA contra PKWARE

La historia del formato de compresión ZIP empieza cuando la empresa SEA, acrónimo de Systems Enhancement Associates, interpone una denuncia contra PKWARE, una empresa más modesta creada en 1986 por Phillip Katz mientras trabajaba en Graysoft, si bien se fue en 1987 para dedicarse exclusivamente a PKWARE. El motivo de la denuncia es que Phil inició su aventura empresarial distribuyendo mediante licencia shareware un nuevo formato de compresión llamado PKARC. SEA argumentaba que PKARC era una copia de su formato ARC, creado por Thom Henderson en 1985. Y estaba en lo cierto, ya que Phil había reescrito el código fuente del software de SEA, disponible de manera oficial en el BBS de la propia Systems Enhancement Associates.

Dejando a un lado ese litigio, que bien podría ocupar otro artículo por sí mismo, Phil Katz dejó de distribuir PKARC y optó por crear su propio programa de compresión llamado PKZIP. Lanzado en 1989, como su nombre indica permitía crear y extraer archivos en formato ZIP, un formato que había creado el propio Phil Katz en colaboración con Gary Conway. Pero a diferencia de lo que ocurría con el formato ARC, Katz decidió que ZIP fuera un formato de dominio público. Es decir, cualquiera podía manejar este formato y crear software compatible sin necesidad de pagar derechos de copyright. Una manera sencilla de que PKZIP y ZIP se hicieran populares.

Fuente: Foone (Twitter)

En cuanto al motivo del nombre ZIP, desconozco el motivo. En inglés ZIP significa cremallera, una buena metáfora de lo que implicaba este formato de compresión, tan rápido como abrir y cerrar una cremallera.

PKWARE se vio beneficiada por esta estrategia, y la difusión de ZIP y su programa PKZIP fueron un éxito entre la comunidad shareware y en los BBS o Bulletin Board System, que eran la principal vía de difusión e intercambio de software en la recién nacida internet. Disponible para DOS, PKZIP tenía licencia shareware a un coste, voluntario, de 25$ o 47$ si querías el manual de uso.

Como hemos visto, ZIP no fue el primer formato de compresión. Antes estaba ARC, que a su vez se había inspirado en uno anterior llamado AR y que junto a SHAR y TAR eran tres formatos habituales en compresión de archivos para UNIX. En paralelo a ARC llegarían otros formatos que han llegado a nuestros días en mayor o menor medida como ARJ y otros que han caído en el olvido como ZOO o DWC. Sin embargo, ZIP logró hacerse un hueco gracias a su difusión gratuita.

Auge y caída de Phillip Katz

El éxito de PKZIP hizo que PKWARE se convirtiera en una empresa multimillonaria. Sin embargo, este éxito no acompañó a Phillip Katz durante toda su vida como veremos más tarde. Nacido un 3 de noviembre de 1962 en Milwaukee, Wisconsin, Phillip Walter Katz se graduó en la universidad de su ciudad natal, la Universidad de Wisconsin-Milwaukee, como ingeniero en ciencia computacional. Enseguida encontró trabajo como programador en Allen-Bradley, empresa dedicada a fabricar automatizaciones y controladores PLC.

Sin moverse de Milwaukee, Phil deja Allen-Bradley para irse en 1986 a Graysoft, una empresa de software en la que emplea su tiempo libre para optimizar el formato de compresión ARC tal y como hemos visto antes. Como consecuencia, crea el programa PKXARC, un extractor de archivos ARC con licencia freeware. Su éxito y buena acogida en los BBS de la época hace que lance otro programa, PKARC, para comprimir en el formato ARC. En esta ocasión, optará por la licencia shareware y fundará su propia empresa, PKWARE en 1986 en su propio domicilio de Glendale, Wisconsin. Como mencioné antes, al año siguiente abandonará Graysoft para dedicarse en exclusiva a su propia empresa.

Fuente: NNDB

Por desgracia, sus buenas dotes como programador optimizando código no estaban a la par con su vida personal. Phillip Katz tuvo problemas de depresión y alcoholismo hasta el punto de ser arrestado en 1991 y en 1992 por conducir ebrio. Entre 1994 y 1999 fue detenido otras cinco veces por el mismo motivo hasta perder su carnet de conducir por orden judicial. A la edad de 37 años fue encontrado muerto en una habitación de hotel el 14 de abril de 2000. El motivo de su muerte, sangrado pancreático agudo como consecuencia de su alcoholismo crónico.

No sabemos qué otros logros profesionales hubiera podido alcanzar Phil Katz, pero nos queda que a la edad de 24 años había mejorado un algoritmo comercial de compresión lanzando sus propios programas de extracción y compresión PKXARC y PKARC y con 27 años había creado su propio formato de compresión, el ZIP, y su propio compresor PKZIP, con la particularidad que el formato ZIP ha llegado hasta nuestros días en forma de estándar.

El papel de WinZip

Cuando hablamos del formato ZIP o Zip, es inevitable hablar de WinZip, el compresor y descompresor de este formato para Windows, el más popular y que, a su vez, tuvo también un papel importante en la popularización de este formato a partir de los años 90. El éxito de WinZip es consecuencia de ser el primero en aparecer.

La primera versión de WinZip, WinZip 1.0, ve la luz en abril de 1991 y no es más que una interfaz gráfica de PKZIP, el programa de Phil Katz. Microsoft Windows empieza a llamar la atención y a hacerse popular, la informática en formato texto empieza a ser desplazada por la interfaz gráfica y se hace necesario adaptar los programas en modo texto a las nuevas interfaces con ventanas. Curiosamente, Katz no vio con buenos ojos Microsoft Windows, de ahí que no se decidiera por lanzar su propio programa con interfaz gráfica. Nico Mak, a través de su empresaNico Mak Computing que luego se llamaría WinZip Computing, aprovechó ese vacío con WinZip y, además, se basó en la estrategia de difusión de PKZIP, licencia shareware.

WinZip fue uno de los programas más descargados para Windows, un programa de obligada instalación durante años incluso cuando Microsoft introdujo el soporte para el formato ZIP en su propio Explorador de archivos. Y con los años fue introduciendo mejoras al legado de Phil Katz, como el cifrado AES de 128 y 256 bits, el soporte para otros formatos de compresión como ARC, LZH o ARJ, mejor integración con cada nueva versión de Windows, el renovado formato ZIP con extensión ZIPX o Zipx y un largo etcétera.

Tras diez versiones o actualizaciones, WinZip y su empresa matriz, WinZip Computing, son adquiridos en 2006 por el gigante Corel, popular por su herramienta ofimática WordPerfect y su editor gráfico CorelDRAW. En la actualidad, WinZip sigue desarrollándose y actualizándose con novedades y mejoras adecuadas a las tendencias actuales, incluyendo versiones para macOS (desde 2010) y para las plataformas móviles iOS y Android.

PKWARE sin Phil Katz

Pero volvamos al origen del formato ZIP. Tras el fallecimiento de Phillip Katz en 2000, su familia decide vender su empresa PKWARE, que a su vez, es vendida de nuevo a Ascent Solutions, una plataforma de software que, en lugar de abandonar el proyecto, lanza un nuevo producto, SecureZIP, y dedica los siguientes años a seguir desarrollando tanto PKZIP como SecureZIP.

En 2009, PKWARE será comprada de nuevo centrándose en el cifrado y la seguridad de datos. Un ejemplo de este enfoque es el lanzamiento en 2012 de Viivo, una herramienta de cifrado en la nube para mejorar la seguridad de Dropbox.

La nueva vida del formato ZIP

En abril de 2010, la ISO (International Organization for Standardization) y la IEC (International Electrotechnical Comission) a través del comité técnico ISO/IEC JTC1 inician un proceso para estudiar la estandarización del formato de compresión ZIP. El proceso terminará en 2015 con el documento ISO/IEC 21320-1:2015. Pero este sello oficial que acredita ZIP como un estándar no es más que la oficialización de algo que ya se sabía, y es que ZIP era un estándar de facto en muchos ámbitos.

Además de como formato de compresión, ZIP pervive en la actualidad gracias a sus características como formato de empaquetado de archivos utilizado por Microsoft, Apple o The Document Foundation, entre otros.

Por un lado tenemos OpenDocument, un estándar de formatos de archivos XML comprimidos en ZIP y que sirven para documentos de texto, hojas de cálculo, gráficos, y presentaciones. El proyecto surge del consorcio de empresas OASIS basándose en el formato OpenOffice.org XML que había creado Sun Microsystems en 2000 para sus suites ofimáticas StarOffice y OpenOffice, la primera comercial y la segunda de código abierto. OASIS introduce el empaquetado en ZIP de manera que en 2005 se lanzan las especificaciones de los formatos ODT, ODS, ODP y ODG, entre otros, y que hoy en día emplean de manera oficial tanto OpenOffice como LibreOffice.

Por su parte, Apple también empleará el empaquetado de documentos XML dentro de GZIP, primero, y ZIP más adelante en sus sucesivas versiones de iWork (2005 en adelante) y que hoy en día están disponibles de manera separada en forma de Keynote, Numbers y Pages para macOS y en versión Web.

Y Microsoft también. Tras introducir los nuevos formatos de documentos XML en Office XP (2000), incorporará los formatos de manera oficial en la versión de Microsoft Office de 2003 con el nombre Office Open XML y como formato por defecto en Office 2007. Además, Microsoft se esforzará en convertir su nuevo formato en estándar europeo a finales de 2006 a través de ECMA y en estándar internacional en 2008 a través de ISO/IEC como intento por contrarrestar los formatos OpenDocument.

Pero hay más. El formato de libro electrónico ePub también se basa en ZIP, convirtiéndose en estándar oficial del International Digital Publishing Forum (IDPF) en 2007.