8,236
edits
Line 16: | Line 16: | ||
== Stockage == | == Stockage == | ||
Dans notre jargon un tel ensemble cohérent de contenus multimédias est appelé un ''dump'' ou encore un ''corpus''. Ces ''dumps'' peuvent avoir plusieurs formes : pour [http://download.kiwix.org/kiwix/ Kiwix v0.5], c'était un simple répertoire, [http://download.kiwix.org/moulinwiki/ Moulinwiki] a utilisé un format ou plusieurs fichiers étaient amalgamés et compressés avec bzip2, l'ensemble étant indexé | Dans notre jargon un tel ensemble cohérent de contenus multimédias est appelé un ''dump'' ou encore un ''corpus''. Ces ''dumps'' peuvent avoir plusieurs formes : pour [http://download.kiwix.org/kiwix/ Kiwix v0.5], c'était un simple répertoire, [http://download.kiwix.org/moulinwiki/ Moulinwiki] a utilisé un format ou plusieurs fichiers étaient amalgamés et compressés avec bzip2, l'ensemble étant indexé dans une base Sqlite. | ||
Aujourd'hui Kiwix | Aujourd'hui, Kiwix se base sur le format ZIM : un format tout en un (tout dans un fichier), qui permet à la fois d'avoir des accès rapides ainsi que une compression forte et paramétrable. | ||
ZIM est un format créé par le [http://www.openzim.org projet openZIM] dont Kiwix est avec d'autres l'initiateur. ZIM est lui-même basé sur un format plus ancien : ZENO. ZENO a été créé par la maison d'édition berlinoise [http://www.digitale-bibliothek.de Directmedia] et a servi pour publié les [http://www.amazon.de/Wikipedia-2007-2008-Kompakt-DVD-ROM/dp/3866400187/ref=sr_1_1?ie=UTF8&s=software&qid=1232812631&sr=8-1 CD-ROM de Wikipédia en allemand]. Aujourd'hui, le format est abandonné, mais nous avons voulu continuer sont développement | ZIM est un format créé par le [http://www.openzim.org projet openZIM] dont Kiwix est avec d'autres l'initiateur. ZIM est lui-même basé sur un format plus ancien : ZENO. ZENO a été créé par la maison d'édition berlinoise [http://www.digitale-bibliothek.de Directmedia] et a servi pour publié les [http://www.amazon.de/Wikipedia-2007-2008-Kompakt-DVD-ROM/dp/3866400187/ref=sr_1_1?ie=UTF8&s=software&qid=1232812631&sr=8-1 CD-ROM de Wikipédia en allemand]. Aujourd'hui, le format est abandonné, mais nous avons voulu continuer sont développement. L'avenir dira si cette initiative sera un succès, mais l'objectif est d'en faire un standard et ainsi simplifier pour chacun la problématique du stockage des ''dumps''. Il est de toute manière déjà la meilleure solution libre. | ||
== Génération == | == Génération == |
edits