Zadanie 1
Zakładamy że pierwsze 1000 pozycji słownika ma równe prawdopodobieństwa
pojawienia się w tekscie i że odpowiadają one za 90% tekstu.
Tzn. każda z nich pojawia się z prawdopodobieństwem 9*10^(-4).
Pozostałe 100000 pozycji słownika daje resztę tekstu i
też ma równe prawdopodobieństwa (równe 10^(-6)).
Przyjmujemy że słowa tekstu są wybierane ze słownika losowo i niezależnie.
Oszacować:
- Ile różnych pozycji słownika pojawi się w tekście długości 20000 słów.
- Jak długi tekst potrzeba by połowa pozycji słownika pojawiła się
co najmniej trzy razy
- Dodatkowo zakładamy że 1 na 100 słów w tekscie jest błędnie
napisane. Ile różnych błędnych słów można oczekiwać w tekście
długości 20000 słów. Jaki to procent w stosunku do poprawnych
pozycji słownika.
Zadanie 2
Przeczytać 'teach grammar' z dystrybucji Pop11 (na chaosie
jest to w '/usr/local/poplog/v15.6/pop/packages/teaching/teach/grammar').
Wykonać znajdujące się tam przykłady.
Zadanie 3
Wypróbować przykładowy parser 'tom'.