Thomson Scientific automatise l'indexation des contenus de ses multiples sources d'information grâce au Text Mining.
Philadelphie, Etats-Unis et Londres, Royaume Uni – le 28 Novembre 2006 – TEMIS, leader en solutions de Text Mining pour l'entreprise et Thomson Scientific, premier fournisseur mondial de contenu scientifique pour les activités de recherche et développement, filiale de Thomson corporation (NYSE: TOC; TSX: TOC), annoncent aujourd'hui la signature d'un contrat de fourniture de licence et de prestation de service. Thomson Scientific a, en effet, choisi la solution d'indexation de TEMIS pour automatiser ses processus de traitement et d'analyse de contenus.
Thomson Scientific fournit aux ingénieurs et aux chercheurs, à travers le monde, un accès à des informations stratégiques et à forte valeur ajoutée, afin d'accélérer la découverte scientifique. Ainsi, avec ISI Web of Knowledge(SM), une solution intégrée d'information pluridisciplinaire unique, Thomson Scientific permet aux chercheurs d'accéder, d'analyser et de gérer l'information.
Thomson Scientific recherchait une solution d'indexation fiable qui puisse être aisément intégrée dans son infrastructure existante et a donc confié à TEMIS l'automatisation du traitement de ses sources de données. La solution devait être capable d'exploiter un dictionnaire de plus de 2 millions d'entrées et d'annoter plus de 100.000 documents par semaine, afin de produire un contenu indexé, enrichi et accessible via le portail ISI Web of Knowledge(SM).
"Chez Thomson Scientific, nous avons l'habitude d'explorer les nouveaux champs d'innovations nous permettant d'enrichir notre contenu.", déclare Sina Adibi, CTO et Senior Vice Président Systèmes et Technologie chez Thomson Scientific. "Nous avons choisi TEMIS, leader sur le marché du Text Mining, car son offre répondait parfaitement à nos exigences les plus strictes, tant en terme de qualité et de précision, qu'en terme de contraintes de production. De plus, la flexibilité des solutions d'analyse de TEMIS nous permet de faire évoluer notre plateforme, ce facteur étant éminemment stratégique dans la mesure où nos contenus et nos besoins changent très fréquemment."
En répondant aux attentes de Thomson Scientific tant en terme de qualité que de montée en charge ou de fiabilité, TEMIS Insight Discoverer(TM) Extractor et TEMIS Insight Discoverer(TM) Categorizer ont rapidement été reconnus comme étant les meilleures technologies du marché pour une solution d'indexation automatique. Thomson Scientific a été particulièrement sensible à la richesse de la librairie d'annotateurs disponibles (Skill Cartridges(TM)) et la possibilité d'ajouter des lexiques simplement.
Les serveurs Insight Discoverer(TM) Extractor et Insight Discoverer(TM) Categorizer résistent parfaitement aux montées en charge. Le serveur d'extraction traite des documents de tout type (Articles de journaux, résumés de publications, brevets, dépêches, contenu web, etc.) afin d'en extraire les entités, les relations, les concepts et les attributs. Le serveur de catégorisation affecte des catégories prédéfinies aux documents selon leur profil sémantique. Enfin, la solution de Text Mining de TEMIS s'appuie sur Intelligent Topic Manager(TM) de Mondeca, une solution puissante de gestion d'ontologies, pour éditer et organiser des terminologies et des taxonomies.
"TEMIS est engagé aux cotés de Thomson Scientific dans un projet innovant d'analyse du contenu pour ISI Web of Knowledge(SM).", déclare Guillaume Mazières, Vice Président Ventes et Marketing de TEMIS. "Nos solutions de Text Mining aident Thomson Scientific à fournir aux Entreprises des contenus intégrés et pertinents, qui, chaque jour, contribuent à accélérer la recherche scientifique."
La solution de Text Mining de TEMIS a été déployée pour indexer les archives numérisées de la base BIOSIS, qui contient plus de 2 millions de documents scientifiques, en identifiant une grande variété d'entités : organismes, composés chimiques, maladies, lieux géographiques, etc. La solution a utilisé un ensemble de Skill Cartridges(TM) personnalisées ou standard (Medical Entity Relationships, Biological Entity Relationships, Text Mining 360°) pour enrichir le contenu de la base BIOSIS avec des métadonnées pertinentes.
Thomson Scientific envisage maintenant de nouvelles évolutions de son processus éditorial comme support à son équipe d'indexeurs, tout en conservant une étape de validation manuelle.
Note: Tim Miller, Directeur Recherche & Développement chez Thomson Scientific, partagera son expérience avec ses homologues du secteur de l'édition lors du salon international Online Information 2006 qui se tient à Londres du 28 au 30 Novembre. Online Information est un évènement incontournable pour les fournisseurs de données qui traite des solutions de contenu en ligne et de gestion de l'information.
A propos de TEMIS
TEMIS est éditeur de logiciels de Text Mining. Ses solutions destinées aux professionnels de l'Intelligence Economique, de la relation client, de la qualité, aux équipes de R&D et à tous les producteurs d'information professionnelle, optimisent le traitement de l'information, en transformant du texte libre en données analysables pour l'extraction d'informations ou le classement automatique de documents, en apportant des gains de productivité conséquents.
Créée en septembre 2000, la société est actuellement présente à travers ses filiales en France, en Allemagne, en Italie, et aux Etats-Unis, et au travers de ses partenaires dans le reste du monde.
La technologie innovante de TEMIS a attiré de grands groupes (Bertelsmann, Lexis Nexis, AFP, juris, MDL Elsevier, Press Index, Thomson Scientific, IPSEN, Novartis, Fournier Pharma, Roche, Total, DaimlerChrysler, PSA Peugeot-Citröen, EADS CCR, TIM-Telecom Italia Mobile, EDF, Documentum, Convera, IBM,etc.).
TEMIS a acquis la confiance de partenaires financiers majeurs puisque le Crédit Agricole Private Equity a pris une participation croissante dans le capital de la société et que ACE Management est devenu actionnaire en 2004.
www.temis.com
À propos de Thomson Corporation et de Thomson Scientific
Thomson Corporation (www.thomson.com), dont le chiffre d'affaires a atteint près de 8,4 milliards de dollars US en 2005, est le premier fournisseur mondial de solutions de traitement de l'information intégrées, destinées aux entreprises et aux professionnels. Thomson propose des systèmes d'information à valeur ajoutée, des outils logiciels et des applications à plus de 20 millions d'utilisateurs dans les domaines du droit, de la fiscalité, de la comptabilité, des services financiers, de la formation universitaire, des données de référence, de la formation et de l'évaluation en ligne, de la recherche scientifique, et de la santé. Ayant établi son siège opérationnel à Stamford (Connecticut, USA), la société Thomson compte environ 40 500 employés et fournit ses services dans près de 130 pays. Les actions Thomson sont cotées à la bourse de New York et de Toronto (NYSE : TOC; TSX : TOC).
Thomson Scientific est l'une des branches de Thomson Corporation. Elle propose aux professionnels des solutions informatiques de référence pour chacune des étapes de recherche et de développement - de la découverte à la distribution, en passant par l'analyse et le développement du produit. Pour en savoir plus sur les solutions de l'information, veuillez consulter : www.scientific.thomson.com
Contacts
TEMIS
Martine Falhon
Corporate Communications
+33 (0)4 56 38 24 03
[email protected]
Thomson Scientific
Kim Yeatman
Media contact
+44 (0)20 7424 2474
[email protected]