Nicht nur für Sprachwissenschaftler interessant ist das „Wortschatzlexikon“ der Universität Leipzig, in welchem - hauptsächlich aus Zeitungsartikeln - schlicht und ergreifend Wörter gesammelt und miteinander in Beziehung gebracht werden - der Fachmann sagt dazu „Effizientes Dokumentenclustering durch niederfrequente Terme“.
Immerhin mehr als 9 Millionen verschiedene deutsche Wörter und Wortgruppen können schon nachgeschlagen werden. Zum Vergleich: Der Duden bringt es gerade mal auf 125.000 Einträge. Auch wenn die (auch graphisch dargestellten) signifikanten Kollokationen, also die eruierten Zusammenhänge, manchmal erstaunen: Was hat „Rhabarber“ mit „überlebenstüchtig“ zu tun?