str_word_count ( string string [, int format])

Wie gesagt, diese Funktionen sind recht nützlich. Allerdings auch tückisch, zumal für uns kompliziert gebaute Europäer, mit unseren vielen Sonderzeichen in unseren Zeichensätzen.
Benutzt man str_word_count ($string,1) um sich ein numerisches array() mit allen Wörtern in der Zeichenkette $string zurückgeben zu lassen, erhält man bei deutschen Zeichenketten im Unicode-Zeichensatz ein recht zerhackstücktes Resultat - denn es können einige Umlaute durch ein Leerzeichen zersetzt worden sein (eigene schmerzhafte Erfahrung).
Die recht einfache und im Gegensatz absolut sichere Methode ist es, stattdessen die Funktion explode() zu verwenden.
Mit
$string = explode(" ",$string);
erhält man auch einen array, vorher sollte man in der Zeichenkette allerdings alle nicht im Unicode-Zeichensatz enthaltenen Zeichen mit entsprechenden Funktionen filtern, Zeilenumbrüche und Tabulatoren durch Leerzeichen ersetzen.
