Uma distribuição conjunta contém todas as informações necessárias para descrever as variáveis aleatórias envolvidas. Isso inclui as distribuições em que apenas algumas das variáveis estão sendo descritas. A marginalização é a maneira de se obter essas distribuições reduzidas.
A marginalização pode ser obtida considerando-se a probabilidade de determinados eventos.
As distribuições trinomial e binomial possuem conexões por de certa forma falarem do mesmo experimento aleatório (de pontos de vista diferentes). Em geral isso é verdade das chamadas distribuições multinomiais (vide cap 6 ex 1f no Ross).
A ideia de considerar a probabilidade de eventos para obter a marginalização se extende para o caso contpinuo (o raciocínio que eu fiz no vídeo dá uma generalização direta do raciocínio discreto, mas não é a maneira mais direta de se obter a marginalização - vide os exercícios).
Da mesma forma que a trinomial e a binomial estão conectadas por uma marginalização, o mesmo é verdade das versões multidimensionais da normal.