SCRIBO press release, April 2008
SCRIBO, a free software project for the semantic treatment of multimedia information, funded during the 5th call for projects of the French R&D clusters.
Paris, on 30 of April 2008 The Direction Générale des Entreprises (from the French Finance, Business and Employment Ministry announced last month the funding by the State and local authorities of the Paris Region of the collaborative industrial R&D project SCRIBO in the framework of the 5th call for projects launched by the competitive fund of Enterprise (FCE). The project had been endorsed in november 2007 by the R&D cluster System@tic within the Free Software thematic. SCRIBO - Semi-automatic and Collaborative Retrieval of Information Based on Ontologies - is aimed to build algorithms and collaborative tools to annotate semi-automatically digital documents. The total funding of the project is 4.3 million euros, the nine partners: AFP, CEA LIST, INRIA, LRDE (Epita), Mandriva, Nuxeo, Proxem, Tagmatica and XWiki (coordinator). According Stefane Fermigier, CEO of Nuxeo: "Thanks to SCRIBO, software editors and integrators who work in the collaborative content management or knowledge management will be able to get a set of software modules and an open source framework allowing them to provide advanced functions of information management, increasing their own competitivity and the one of their users". For Arnaud Laprévote, Director of Research projects at Mandriva: "With SCRIBO, search of information in computer documentation will be dramatically eased. SCRIBO will allow the online help of Linux distributions to join a new era. Search, navigation and use of documentation will be transformed and will make Mandriva Linux even more available to anyone". "SCRIBO is part of the Web 3.0 technologies, which means the multimedia semantic massively participative Web. Coupling within a wiki user-controled annotations and automatic ones opens new possibilities in collective knowledge creation, indexation and transmission. The availability under a free software licence of the results and standards produced by the SCRIBO consortium will produce a positive economic, social and cultural impact, beyond the circle of partners. International collaborations with other projects are also scheduled", added Stéphane Laurière, Research Director at XWiki and SCRIBO coordinator.Partners in the project
The partners of the SCRIBO project are:- computer laboratories specialized in graphic and textual documents analysis and knowledge extraction: ALPAGE team of INRIA and Paris 7 University, Research and Development laboratory of EPITA, Knowledge engineering laboratory of CEA-LIST;
- SME software editors of content management: Nuxeo (Enterprise content management); XWiki, software editor of collaborative solutions Web 2.0; Proxem, editor of Natural language processing semantic analysis solutions; Tagmatica, specialized in syntaxic analysis and ISO normalization;
- content partners and users of SCRIBO technologies: Agence France-Presse news agency et Linux distributor Mandriva.
Impact
Les composants réalisés seront intégrés dans les suites logicielles respectives des éditeurs Nuxeo, Proxem et XWiki. L'atelier de traitement sera mis en oeuvre et évalué dans le contexte de deux cas d'utilisation:- l'AFP, qui utilise déjà les outils Nuxeo et XWiki, expérimentera les composants SCRIBO dans le contexte de l'annotation semi-automatique de flux d'informations multimédia multilingues, aussi bien dans des domaines généraux que thématiques ainsi que dans un contexte de veille;
- Mandriva, déjà utilisatrice d'XWiki pour une de ses plateformes communautaires, mettra en oeuvre les composants SCRIBO d'une part pour procéder à l'annotation automatique de la documentation du système d'exploitation Mandriva Linux (manuels techniques, questions-réponses, articles de presse, interviews, etc.) dans le but d'améliorer l'accès à des informations spécifiques dans différentes langues (Mandriva est utilisée dans plus de 80 pays et comporte des communautés multilingues de plusieurs dizaines de milliers d'utilisateurs), d'autre part pour enrichir les fonctionnalités du bureau sémantique KDE.
A propos de...
Nuxeo
La société Nuxeo se consacre au développement et au support de la plateforme Nuxeo, logiciel de gestion de contenu d'entreprises fondé sur les technologies Java EE 5 et la vision d'un « ERP du document ». La société développe et met en oeuvre son logiciel selon le modèle open source, sans coût de licence et sur le principe de souscription dépendant des déploiements et non du nombre d'utilisateurs. Présente sur ce marché depuis 2001, Nuxeo a fourni des solutions globales d'ECM à de nombreuses grandes entreprises, ce qui en fait le pionnier et le leader de la révolution de l'ECM open source. Son siège social se situe à Paris, avec des filiales au Royaume-Uni et en Roumanie. Nuxeo travaille en collaboration avec un réseau de partenaires intégrateurs tels qu'Atos Origin, Business & Decision, Capgemini, Eurocis, LogicaCMG/Unilog et bien d'autres, fournissant ainsi aux utilisateurs une large gamme de services professionnels comprenant notamment support, conseil, développement, formation et certification. Plus d'informations: http://www.nuxeo.com/L'équipe ALPAGE (INRIA / Université Paris 7)
ALPAGE est une équipe mixte entre l'INRIA (centre de recherches de Paris-Rocquencourt) et l'Université Paris 7 (UFR de linguistique). L'équipe a pour objectif premier le développement et la mise en oeuvre de technologies pour l'analyse automatique de textes en français. Ceci passe par une meilleure compréhension et une meilleure formalisation des phénomènes linguistiques, y compris les plus complexes, puis leur prise en compte dans des modèles lexicaux et grammaticaux. Ces modèles doivent alors être mis en oeuvre à l'aide de technologies algorithmiques et logicielles avancées, à la fois symboliques et probabilistes. Ces travaux prennent tous leur sens dans le cadre d'applications concrètes. ALPAGE se concentre ainsi sur la construction d'outils de recherche d'informations linguistiques et extra-linguistiques, mais aussi de fouille de textes et de correction orthographique, grammaticale et stylistique.Le Laboratoire de Recherche et de Développement de l'EPITA (LRDE)
Le LRDE a été créé en février 1998 pour promouvoir l'activité de recherche à l'École Pour l'Informatique les Techniques Avancées (EPITA). La politique du LRDE comprend deux grands axes: d'une part une activité de recherche propre à l'école sur ses sujets de prédilection, avec un objectif de reconnaissance scientifique grâce à des publications et des collaborations avec d'autres centres de recherche ; d'autre part, une activité de recherche appliquée, en collaboration avec des industriels afin de valoriser la recherche conduite en interne et de permettre un auto-financement de la recherche. Le LRDE développe une bibliothèque générique et performante de traitements d'images, Olena. Ce projet a pour objet la réalisation d'une plate-forme de calcul numérique scientifique dédiée au traitement d'images, à la reconnaissance des formes et à la vision par ordinateur. Cet environnement est composé d'une bibliothèque générique hautes performances, d'un ensemble d'utilitaires pour scripts shell, ainsi que, à terme, d'un environnement interprété à la façon de MatLab ou Mathematica et d'un environnement de programmation visuel. Enfin, le LRDE a travaillé pendant 6 ans sur le sujet de la dématérialisation de documents papier dans le cadre d'un accord de partenariat avec un acteur industriel majeur du domaine.Agence France-Presse (AFP)
L'AFP est une agence de presse mondiale fournissant une information rapide, vérifiée et complète sur les événements qui font l'actualité internationale, des guerres et conflits à la politique, au sport, au spectacle jusqu'aux grands développements en matière de santé, de sciences ou de technologie. Ses 2.900 collaborateurs répartis dans 165 pays rendent compte en six langues de la marche de la planète, 24 heures sur 24, en vidéo, texte, photo, multimédia et infographie. Plus d'informations: http://www.afp.com/Mandriva
Mandriva, anciennement Mandrakesoft, édite le système d'exploitation Mandriva Linux, un des systèmes Linux les plus complets, les plus simples à utiliser et les plus populaires à travers le monde. Ayant à coeur de fournir des solutions open source accessibles à tous, Mandriva Linux est au centre d'une gamme de produits et services destinés non seulement aux entreprises mais également aux administrations et particuliers. Les produits de Mandriva sont disponibles en ligne dans près de 80 langues et dans plus de 140 pays par le biais de canaux de distribution dédiés. Basée à Paris, la société est inscrite au Marche Libre d'Euronext Paris. Plus d'informations: http://www.mandriva.comTagmatica
Tagmatica est une société spécialisée dans le traitement automatique du langage. L'activité de Tagmatica comporte deux axes :- La rédaction de spécifications techniques. Gil Francopoulo (de Tagmatica) est l'un des deux auteurs de la norme ISO des dictionnaires pour le traitement automatique (Lexical Markup Framework).
- Le développement de l'analyseur syntaxique TagParser pour le français et l'anglais. TagParser est un analyseur robuste et opérationnel principalement utilisé dans l'extraction d'information dans des corpus textuels de dizaines de millions de mots.
Le Laboratoire d'intégration des systèmes et des technologies du Commissariat à l'Energie Atomique (CEA LIST)
Acteur majeur en matière de recherche, de développement et d'innovation, le Commissariat à l'Energie Atomique intervient dans trois grands domaines : l'énergie, les technologies pour l'information et la santé, la défense et la sécurité ; en s'appuyant sur une recherche fondamentale d'excellence. Fort de ses 15000 chercheurs et collaborateurs, le CEA constitue une force d'expertise et de proposition pour les pouvoirs publics. Le CEA, moteur de l'innovation, contribue aux succès des industriels français et européens au travers des programmes de partenariat et de transfert de technologie. Le CEA LIST, qui mène des recherches en ingénierie de la connaissance multimédia multilingue, développe depuis plusieurs années des technologies pour la recherche d'information et l'extraction de connaissances qui reposent sur une plateforme d'analyse d'images et d'analyse linguistique capable de traiter des langues aussi diverses que les langues romanes, germaniques, sémitiques ou asiatiques. Plus d'informations: http://www-list.cea.fr/Proxem
Proxem ("Procédures sémantiques") est une jeune entreprise innovante, éditrice de logiciels de Traitement Automatique du Langage. Sa mission est d'aider les organisations à intégrer ces technologies dans leur Système d'Information, avec une gamme logicielle épaulée par une offre de conseil. Proxem édite notamment le framework Antelope, un analyseur sémantique de textes, doté de capacités linguistiques. Ses applications concrètes sont nombreuses :- Réconciliation des données non-structurées et structurées des organisations,
- Moteur de recherche sémantique (e-commerce, encyclopédies, intranets, sites web),
- Outils de veille économique (analyse de news, recherche ciblée d'information, analyse des sentiments exprimés sur des blogs),
- Applications de type Web sémantique.
XWiki
XWiki étend à l'ensemble du système d'information de l'entreprise la métaphore du wiki, c'est-à-dire la facilité à créer des objets numériques à plusieurs et à les relier les uns aux autres (textes, documents métiers semi-structurés, applications). XWiki décloisonne les applicatifs d'entreprise et amplifie l'intelligence collective du réseau de collaborateurs. La gamme de solutions XWiki Collaboration Suite est disponible sous licence libre LGPL et place XWiki parmi les leaders mondiaux du wiki d'entreprise. Les principaux axes de R&D XWiki en 2008-2009 sont le Web collaboratif, le Web sémantique, l'ingénierie du document électronique, les architectures pair-à-pair, les technologies de mobilité, le traitement automatique du langage, les interfaces graphiques et les architectures logicielles en général. XWiki a son siège à Paris et est également implantée en Roumanie et aux Etats-Unis. EADS, Total, Orange, Aélia (Groupe Lagardère) ou encore NEC font partie des centaines de sociétés utilisatrices de la technologie XWiki à travers le monde. Plus d'information: http://xwiki.com.Site Web et contact
- SCRIBO: http://scribo.ws
- Contact: contact@scribo.ws
Version 1.3 modifié par Denis Teyssou le 27/04/2008 à 20:23