- jeu. 24 juin 2021 21:05
#206725
Bonjour à tous,
Je suis actuellement sur un projet dans le domaine du Machine Learning, le but est de faire une classification supervisée sur un ensemble de données. Mes données sont un grand nombre de fichiers pdf , chaque fichier à une classe precise, le but est d'utiliser ces fichiers la comme jeu de données d'apprentissage afin de faire de la prediction de la classe sur de nouveaux fichiers.
Mon probléme c'est que je ne sais pas comment construire mon jeu de données d'entrainement vu que l'algrithme de classification doit s'entrainer sur le contenu de chaque fichier et dans mon data Frame d'entrainement j'ai la classe de chaque fichier et le nom du fichier en question. comment faire pour inclure le contenu de chaque fichier pdf dans mon Data Frame d'entrainement ?
Merci par avance pour vorte aide
Je suis actuellement sur un projet dans le domaine du Machine Learning, le but est de faire une classification supervisée sur un ensemble de données. Mes données sont un grand nombre de fichiers pdf , chaque fichier à une classe precise, le but est d'utiliser ces fichiers la comme jeu de données d'apprentissage afin de faire de la prediction de la classe sur de nouveaux fichiers.
Mon probléme c'est que je ne sais pas comment construire mon jeu de données d'entrainement vu que l'algrithme de classification doit s'entrainer sur le contenu de chaque fichier et dans mon data Frame d'entrainement j'ai la classe de chaque fichier et le nom du fichier en question. comment faire pour inclure le contenu de chaque fichier pdf dans mon Data Frame d'entrainement ?
Merci par avance pour vorte aide