Articles of nlp

Python ou Java pour le traitement de texte (exploration de texte, recherche d’informations, traitement en langage naturel)

Je vais bientôt commencer un nouveau projet où je vais effectuer de nombreuses tâches de traitement de texte telles que la recherche, la catégorisation / classification, la mise en cluster, etc. Il y aura une énorme quantité de documents à traiter; probablement des millions de documents. Après le traitement initial, il doit également pouvoir être […]

Détection de phrases à l’aide de la PNL

J’essaie d’parsingr des phrases d’une grande quantité de texte. En utilisant Java, j’ai commencé avec des outils de PNL tels que OpenNLP et Parser de Stanford. Mais voici où je suis coincé. bien que ces deux parsingurs soient assez bons, ils échouent quand il s’agit d’un texte non uniforme. Par exemple, dans mon texte, la […]

Détecter un pronom et son nom?

Vous vous demandez s’il existe un outil qui peut m’aider à détecter le nom d’un pronom dans un texte. Exemple Jone is Spanish. He can speak German. Comment puis-je étiqueter He to Jone ?

similitude sémantique entre les phrases

Je fais un projet. J’ai besoin d’un outil ou d’une technique opensource pour trouver la similarité sémantique entre des phrases où je donne une entrée en deux phrases et une sortie en tant que score (similitude sémantique). à bientôt. merci à tous.

Génération d’AQ sur les sous-phrases – PNL

Mon jeu de données est structuré comme suit: Produit1 – Phrase1 Produit2 – Phrase2 Produit3 – Phrase3 . . etc Les phrases ressemblent à ceci: Produit1 – “Nous vous suggérons de porter cette pièce élégante avec des boucles d’oreilles dorées, des leggings churidars et des chaussures plates pour compléter un look sobre.” Une question possible […]

Comment utiliser l’parsingur de Stanford

J’ai téléchargé l’parsingur Stanford 2.0.5 et j’utilise le code source Demo2.java contenu dans le package, mais après avoir compilé et exécuté le programme, celui-ci comporte de nombreuses erreurs. Une partie de mon programme est: public class testStanfordParser { /** Usage: ParserDemo2 [[grammar] textFile] */ public static void main(Ssortingng[] args) throws IOException { Ssortingng grammar = […]

Augmenter les performances du programme basé sur Stanford-tagger

Je viens de mettre en œuvre un programme qui utilise le marqueur POS de Stanford en Java. J’ai utilisé un fichier d’entrée de quelques Ko, composé de quelques centaines de mots. J’ai même défini la taille du tas à 600 Mo. Mais il est toujours lent et manque parfois de mémoire. Comment puis-je augmenter sa […]

Bibliothèque italienne issue de java

Je cherche une bibliothèque java ou quelque chose à faire avec des chaînes de mots italiennes. Le but est de comparer les mots italiens. En ce moment, des mots comme “attacco”, “attacchi”, “attaccare”, etc., sont considérés comme différents, mais je souhaite obtenir une véritable comparaison. J’ai trouvé quelque chose comme Lucene, snowball.tartarus.org, etc. Y at-il […]

Utilisation de Stanford Parser (CoreNLP) pour rechercher des en-têtes de phrases

Je vais utiliser Stanford Corenlp 2013 pour trouver des têtes de phrase. J’ai vu ce fil . Mais la réponse n’était pas claire pour moi et je ne pouvais append aucun commentaire pour continuer ce fil. Donc, je suis désolé pour la duplication. Ce que j’ai pour le moment est l’arbre d’parsing d’une phrase (en […]

extraire les verbes anglais d’un texte donné

Je dois extraire tous les verbes anglais d’un texte donné et je me demandais comment je pouvais le faire … À première vue, mon idée est d’utiliser des expressions régulières car tous les temps des verbes anglais suivent des schémas, mais il existe peut-être un autre moyen de le faire. . Ce que j’ai pensé, […]