Chaîne stochastique à mémoire de longueur variable

De testwiki
Aller à la navigation Aller à la recherche

Une chaîne stochastique à mémoire de longueur variable fait partie d'une famille de chaînes stochastiques d'ordre fini dans un alphabet fini. L'idée est que, pour chaque passé, seul un suffixe fini du passé, appelé le contexte, est nécessaire pour être capable de prévoir le prochain symbole. Ces modèles ont été introduits dans la théorie de l'information par Jorma Rissanen, en 1983, comme un outil universel pour la compression des données[1]. Récemment, ces chaînes ont été utilisées pour modéliser des données dans différents domaines tels que la biologie[2], la linguistique[3] et la musique[4].

Définition

Une chaîne stochastique à mémoire de longueur variable est une chaîne stochastique , prenant des valeurs de l'alphabet fini et représentée par un arbre probabiliste de contextes , tel que[5]:

  1. est l'ensemble de tous les contextes. Un contexte , étant la taille du contexte, est une portion finite du passé qui est nécessaire pour prédire le prochain symbole ;
  2. est une famille de probabilités de transition associée à chaque contexte.

Histoire

La classe de chaînes stochastiques à mémoire de longueur variable a été introduite en 1983 par Jorma Rissanen, dans l'article A universal system for data compression system[1]. Cette classe de chaînes stochastiques a été popularisée dans la communauté des probabilités et statistiques par P. Bühlmann et Abraham J. Wyner, en 1999, dans l'article longueur Variable Length Markov Chains. Bühlmann et Wyner ont alors appelé cet objet mathématique de « chaînes de Markov à longueur variable ». Ces chaînes sont également connues sous le nom de « modèles de Markov d'ordre variable », « arbres probabilistes de suffixes »[2] et « modèles générés par des arbres de contexte »[6].

Notions liées

Références

Modèle:Références

Modèle:Palette Modèle:Portail