Mots-clés de chaîne

voix
2

Quelqu'un sait-il d'une fonction PHP disponible qui prend un morceau de texte, avec dire quelques centaines de mots et produit un tableau de mots-clés? C'est à dire. le plus important, survenant fréquemment des termes uniques?

Merci Philip

Créé 27/08/2009 à 02:21
source utilisateur
Dans d'autres langues...                            


2 réponses

voix
7

Il n'existe pas une telle fonction (serait magique si elle a fait), mais de commencer quelque chose hors, vous pouvez faire ce qui suit:

  1. Diviser le texte à l'espace, la production d' un tableau de mots.
  2. Retirer le stop-mots et la ponctuation et les symboles inutiles (éventuellement en utilisant des expressions régulières - Voir preg_replace).
  3. Compter le nombre d'occurrences de chaque mot dans la matrice restante, et le tri par ordre de fréquence ( de sorte que le mot le plus fréquemment se produisant est au premier décalage, ie $words[0]).
  4. Utilisez array_unique pour supprimer les doublons, produisant ainsi un tableau de mots - clés uniques commandés par fréquence d'apparition.
Créé 27/08/2009 à 02:32
source utilisateur

voix
0

Quelque chose comme cela pourrait faire l'affaire:

$thestring = 'the most important, frequently occuring unique terms?';
$arrayofwords = explode(" ", $thestring);
echo print_r($arrayofwords);

Aussi, vous pouvez remplacer la virgule « » pour un blanc, vous obtenez des mots-clés propres.

$thestring = 'the most important, frequently occuring unique terms?';
$cleaned_string = str_replace(",", "", "$thestring");
$arrayofwords = explode(" ", $cleaned_string);
echo print_r($arrayofwords);
Créé 27/08/2009 à 02:38
source utilisateur

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more