Lecture: Big Data

L’histoire de comment j’ai été incité à lire ce livre est différente des autres. Un collègue l’a pré commandé au nom de la compagnie lorsqu’il était en cours de rédaction. Ledit collègue a quitté la compagnie il y a plus d’un an et le livre nous a été livré il y a quelques semaines. Comme je travaille en (buzzword) Big Data et que le bouquin a le même titre je me suis dit «pourquoi pas?».

Le livre nous introduit d’abord à l’architecture lambda (lien anglais) ce qui est intéressant. Ensuite, on pose trois problèmes théoriques qui vont nous suivre tout le long de notre lecture: Comment calculer une somme (ex.: pages vue), comment opérer sur deux sommes (ex.: taux de rebond) et comment calculer un compte d’uniques (e.: nombre de visiteurs uniques). On explique comment traiter chacune de ces opérations dans chacune des couches de l’architecture lambda.

Le hic, c’est que la partie intéressante, la partie théorique, représente une portion minoritaire du livre. Le reste est consacré à des échantillons de code directement liés à des implémentations sur des technologies existantes. À moins de souhaiter utiliser les mêmes technologies, les chapitres pratiques ont une valeur presque nulle. On se retrouve donc avec un livre intéressant à moins de 33%.

Est-ce que le titre est bon? Non. Le «bon» titre aurait plutôt été: “Practical guide to lambda architecture with Hadoop, JCascalog, Pail, ElephantDB, Apache Cassandra, Apache Storm, Apache Thrift, Apache Kafka, Apache Trident et Apache you-name-it.”

Big Data Book Cover Big Data
Nathan Marz, James Warren,
Computers
Manning Publications
2015-03-31
328

Leave a Reply