La corrispondenza fra AVO ed ES è implementata tramite l'interfaccia verso i flussi elementari, precedentemente descritta, e la trasmissione delle informazioni di corrispondenza, in modo simile a quanto avviene in MPEG-2 tramite i PSI (Program Specific Information), che danno una descrizione del contenuto di uno stream e lo associano ad un particolare recipiente. La descrizione del contenuto è stata eliminata in MPEG-4, in quanto ritenuta una fonte di possibile ambiguità.
In MPEG-2, il protocollo DSM-CC (Digital storage medium command and control) fornisce un ulteriore metodo di gestione del contenuto, permettendo, ad esempio, la selezione di programmi nel Video On Demand. Probabilmente anche l'MPEG-4, che dà una grande importanza all'interattività, comprenderà un protocollo simile a DSM-CC nella versione finale delle specifiche.