|
|
Deutsch - English - Français
Version test
Acheter
|
|
ABBYY FineReader XIX for Fraktur
Pour la reconnaissance des écritures européennes anciennes
La première solution OCR de reconnaissance de lettres européenness anciennes et du gothique jamais mise à ce jour sur le marché, ABBYY FineReader XIX est une version spéciale basée sur la technologie du fameux OCR FineReader pour la reconnaissance de textes anciens notamment du gothique dit "Fraktur" ou "black letter" entre 1800 et 1938, mais également de caractères plus anciens imprimés (selon la qualité d'impression). Elle a été conçue pour convertir le contenu des anciens documents, livres et papiers vers des textes modernes dans le cadre de l'archivisation du patrimoine et de la réédition de ces ouvrages. Le défi consistant à numériser des textes anciens
Jusqu'à présent, les limites de la technologie et le caractère unique et à la fois varié des lettres anciennes rendaient la reconnaissance automatique difficile de ces anciens et fragiles ouvrages par nos ordinateurs modernes. Des dictionnaires OCR sophistiqués, des Modèles Linguistiques utilisés pour l'analyse et la vérification de ces textes n'existaient pas encore. Et les systèmes informatiques qui s'y essayaient prenaient un temps incalculable pour entraîner la solution à reconnaître de façon fidèle ces caractères tombés dans la désuétude.
| |
La typologie de type "black letter", également connue sous l'appellation "écriture cassée", est apparue au début du 12e siècle pour évoluer à travers les âges vers différentes variétés d'écritures et de typologies. L'écriture gothique dite "Fraktur", très répandue en Allemagne, a été créé sous l'impulsion de l'Empereur Maximilian et sera très usitée dans de nombreux pays d'Europe. La typologie "Fraktur" se caractérise par une élongation du "s", des ligatures et des lettres "jointes" pour certaines combinaisons de lettres. La fréquence de son utilisation justifie le développement d'une telle technologie pour soutenir l'étude de ces textes anciens, patrimoine mondial, et leur conservation.
L'unique solution pour la reconnaissance de caractères européens anciens ABBYY FineReader XIX est l'unique solution de reconnaissance des écritures européennes anciennes par excellence, dont la très répandue typologie "Fraktur", permettant aux utilisateurs de numériser et de convertir d'anciens documents et ouvrages sans qu'une formation poussée ne soit requise. Cette solution a été réalisée grâce au savant mélange de la technologie intelligente d'ABBYY et des études linguistiques.
Les systèmes OCR fonctionnent en analysant une image de texte et en appliquant ensuite des hypothèses sur les lettres ou les mots que l'image lue représente. Les hypothèses sont analysées dans un certain contexte et vérifées à l'aide des dictionnaires OCR sophistiqués basés sur des modèles de linguistiques (LMs). Ces modèles sont rassemblés dans une base de données qui décrit le vocabulaire d'une langue donnée. La principale difficulté réside dans le fait que les systèmes OCR actuels ne possèdent pas de Modèles Linguistiques de lettres provenant de textes anciens. C'est sur la base de ce constat qu'ABBYY FineReader XIX a été conçue et des dictionnaires OCR spéficiques à ces périodes développés. Des Modèles Linguistiques spéciaux ont été ainsi créés pour 5 langues européennes.
Les Modèles Linguistiques pour la typologie "Fraktur" ont été créés à l'aide du partenaire d'ABBYY : ATAPY Software. Durant la phase de développement, 10 différents dictionnaires et plus de 105 livres publiés entre 1808 et 1930 ont été analysés et passés au peigne fin. Des linguistes ont été appelés à contribution pour passer en revu les différents termes, à identifier les mots que le temps et l'évolution des langues ont altéré le sens voire effacer l'existence; la synthaxe afin d'être en conformité avec les structures grammaticales des époques concernées. Plus de 500 000 mots entrés dans le dictionnaire gothique ont étés comparés avec la base existante des dictionnaires FineReader.
|
|
 |
|
Les évolution des modèles grammaticaux et des termes ont été revues pour être ajoutées aux 159 modèles grammaticaux qui ont existé dans l'histoire de la linguistique mais qui ont disparu des modèles contemporains. Les Modèles Linguistiques ont été rassemblés et testés sur la base de documents anciens prévus à cet effet.
Afin de reconnaître la typologie "Fraktur", les équipes de développement d'ABBYY ont créé des classeurs spécifiques ou alphabets capables de reconnaître les symboles propres à "Fraktur". Pour ce, l'équipe d'ABBYY a collecté des images de symboles et signes basés sur un échantillon d'environ 2500 symboles et signes rien que pour chacun d'entre eux; un nouveau modèle d'alphabet, et a à la fois rassemblé et ajouté une base d'échantillon représentant l'équivalent de 31 000 pages de textes divers provenances. A travers l'utilisation d'échantillon de texte, le moteur de reconnaissance a été amélioré et affiné pour traiter les plus fines subitiliés propres à la typologie "Fraktur" (telles que les ligatures ou les lettres liées). Le nouvel alphabet a été donc ajouté dans le système et l'interface de FineReader puis rigoureusement testé.
Une solution créée en coopération avec les principaux établissements d'archivage ABBYY FineReader XIX a été également développé pour répondre aux besoins des universités et centre de recherches. Le produit a été réalisé en coopération avec le projet international METAe initié par le Commission Européenne dans le cadre du 5e Programme des Technologies de la Société de l'Information (IST), intitulé "Héritage Numérique et Contenu Culturel". C'est un consortium de bibliothèques et d'entreprises de numérisation européennes collaborant à la création du moteur METAe, une solution spécialement conçue pour gérer le flux d'ouvrages (livres, documents, journaux, papiers, magazines) historiques en vue de leur conversion puis de leur archivage. ABBYY FineReader XIX a été la clé de voûte de ce projet d'archivage de précieux et inestimables ouvrages historiques. Parmi les partenaires membres de ce projet, on a pu compter : la Bibliothèque Nationale de France, l'Univeristé d'Innsbruck (Austriche), l'Université de Florence (Italie), la Bibliothèque Nationale de Norvège, La Fondation Friedrich-Ebert-Foundation (Allemagne), CCS Compact Computer Systeme (Allemagne), et la Cornell Library University (USA).
Spécifications Techniques
Système d'exploitation :
- PC avec Intel® Pentium®/Celeron®/Xeon™, AMD K6/Athlon™/ Duron™ ou processeur compatible de 200 MHz au minimum
- Microsoft Windows 2003, Windows XP, Windows 2000, Windows NT 4.0 (SP6 ou supérieur), Windows Me/98 (pour travailler avec des interfaces locales il est conseillé d'avoir installé au préalable les langues correspondantes)
- 64 Mo de RAM pour Windows 2003/XP/2000/NT4.0; 3 2 Mo de RAM pour Windows Me/98. 16 Mo de RAM supplémentaires sont requis pour chaque processeur supplémentaire dans un système multi-processeur
- 230 Mo de disque dur pour les installations courantes, 70 Mo de disque dur pour lancer le programme
- Microsoft® Internet Explorer 4.0 ou supérieur (Microsoft® Internet Explorer 5.01 est compris dans le pack livré)
- 100% TWAIN-compatible scanner, appareil photo numérique, ou modem pour fax
- Carte vidéo et moniteur (résolution minimale 800x600)
- Clavier, souris et autres appareils périphériques device
Types d'images / formats pris en charge :
- BMP: N&B, gris, couleur
- PCX, DCX: N&B, gris, couleur
- JPEG: gris, couleur
- JPEG 2000, part1: gris, couleur
- PNG: N&B, gris, couleur
- TIFF: N&B, gris, couleur, multi-image. Méthodes de compression: Unpacked, CCITT Group 3, CCITT Group 3 FAX(2D), CCITT Group4, PackBits, JPEG, ZIP
- PDF
Formats de sauvegarde
- Microsoft®Word XP, 2000, 97, 95
- RTF
- TXT
- Unicode Text
- Microsoft®Excel XP, 2000, 97, 95
- HTML 3.2/4.0
- Unicode HTML 3.2/4.0
- DBF
- CSV
- PDF 3.0/4.0
Contact
ABBYY Sales support: sales_EU@abbyy.com
Si vous avez des questions supplémentaires, n'hésitez pas à nous contacter aux coordonnées ci-dessous :
Pour les Etats-Unis, veuillez contacter ABBYY USA au 510-226-6717
Numéros locaux gratuits
| Autriche |
0800 292 706 |
| Allemagne |
0800 2008800 |
| Suisse |
0800 561 227 |
| Belgique |
0800 80967 |
| Danemark |
80200042 |
| Finlande |
0800 9 5295 | |
| France |
0805 770064 |
| Grèce |
00800 441 45300 |
| Irlande |
1800 946794 |
| Islande |
8008800 |
| Italie |
800920032 |
| Luxembourg |
800 221 33 | |
| Hollande |
0800 0200171 |
| Norvège |
800 36970 |
| Portugal |
800 844 427 |
| Espagne |
900 81 03 69 |
| Suède |
0200 810345 |
| Angleterre |
0800 028 4515 | |
|
|