Ce document explore des modèles de recherche d'information basés sur des fondements théoriques d'information, utilisant notamment l'information de Shannon pour évaluer la pertinence des mots dans les documents. Il aborde des concepts tels que la 'rafale' dans les apparitions des mots et propose des modèles log-logistiques et de loi de puissance lissée pour mieux prédire les fréquences de termes dans les documents. Les auteurs valident leurs modèles par des expériences et discutent de l'ajustement de ces modèles aux données.