Інформатика Тема «Текстовий редактор» Використовуючи мережу Internet, створити міні-посібник у текстовому редакторі Word за планом: системи оптичного розпізнавання сканованого тексту; створення документів іноземними мовами; автоматичний переклад документів з використанням програм-перекладачів.
Творче завдання (за бажанням) (12 балів) Участь у конкурсі «Моя школа майбутнього», номінація - фотоколаж (див. Новини на сайті - Обласний конкурс «Моя школа майбутнього»)
Програми перекладу (системи машинного перекладу) з'явилися у відповідь на потреби користувачів в оперативному перекладі різної комерційної, технічної або INTERNET-інформації, яка подана в електронному вигляді. Крім перекладу з іноземних мов, важливе значення має переклад з української (російської) мови іншими мовами, зокрема англійською. Аналізуючи програми машинного перекладу, потрібно відразу уточнити, що вимоги до них не повинні бути такими ж, як і до перекладу, який виконує людина. Переклад, зроблений комп'ютером, поки що далеко не ідеальний, але текст, отриманий в результаті роботи електронного перекладача, дозволяє в більшості випадків зрозуміти суть документа, який перекладався. Далі цей документ можна корегувати, маючи базові знання іноземної мови та добре орієнтуючись в предметній галузі, до якої належить інформація, що перекладається. Одними з найбільш відомих програм машинного перекладу на ринку України є STILUS, ПАРС, Language Master. Ці програми-WINDOWS-додатки, які підтримують технологію Drag&Drop, OLE-автоматизацію, мають оперативну довідкову систему, графічну діалогову настройку, а також інші елементи управління вікнами та опціями, що робить ці програми справді популярними серед користувачів. Розглянемо критерії, за якими порівнювались вказані вище програмні продукти. 1. Інсталяція/Деінсталяція характеризує можливість установки та знищення програм машинного перекладу з комп'ютера користувача. 2. Швидкість перекладу визначає, наскільки швидко можуть бути перекладені текстові документи великих розмірів. 3. Кількість неперекладених слів характеризує словники, які супроводжують програми машинного перекладу. 4. Якість перекладу визначає граматичну коректність перекладу. 5. Зручність настройки програми та словників визначає дружелюбність інтерфейсу користувача. 6. Використання у мережі засвідчує можливість застосування програми-перекладача для колективної роботи. 7. Документація дозволяє отримати первісні поняття та теоретичні знання про програму. 8. Робота з Web-браузером дає можливість виконувати оперативний переклад Web-сторінок.
Cистеми оптичного розпізнавання сканованого тексту Основним методом перекладу паперових документів в електронну форму є сканування. Сканування - це технологічний процес, в результаті якого створюється графічний образ паперового документа. Існує кілька різних видів сканерів, але в їх основі лежить один і той же принцип. Документ освітлюється світлом від спеціального джерела, а відображене світло сприймається світлочутливим елементом. Мінімальний елемент зображення інтерпретується сканером як кольорова (або сіра) крапка. Таким чином, в результаті сканування документа створюється графічний файл, у якому зберігається растрове зображення вихідного документа. Растрове зображення складається, як відомо, з точок. Кількість точок визначається як розміром зображення, так і роздільною здатністю сканера.
Сканери для введення текстів та ілюстрацій (спеціальні типи сканерів) Листові сканери-Сканери цього типу дозволяють за одну операцію сканувати аркуш паперу стандартного формату Ручні сканери-Це найпростіший вид сканерів, що дає найменш якісне зображення Барабанні сканери-призначені для сканування не паперових документів, а прозорих матеріалів, наприклад слайдів, негативів і т. п. Сканери форм-спеціальні сканери для введення інформації з заповнених бланків Штрих-сканери-призначені вони для зчитування штрих-кодів з маркування товарів у магазинах
Автоматичний переклад документів з використнням програм-перекладачів Перекладом називається процес та результат створення на основі вхідного тексту однією мовою рівноцінного йому в комунікативному відношенні тексту іншою мовою. При цьому комунікативна рівнозначність, або еквівалентність, розуміється як така якість тексту перекладу, котра дозволяє йому виступати в процесі спілкування носіїв різних мов у ролі повноправної заміни вхідного тексту (оригіналу) в сфері дії мови перекладу. Переклад може здійснюватися:
· з однієї мови на іншу – нерідну, родинну, близькоспоріднену;
· з літературної мови на її діалект та навпаки, або з діалекту однієї мови на іншу літературну мову;
· з мови древнього періоду на мову у її сучасному стані (наприклад, з давньоруської мови на сучасну російську, зі староанглійської на сучасну англійську та т.п.). Розвиток новітніх технологій зробив можливим машинний переклад, тобто переклад, який побудовано на використанні машиною визначених та постійних для даного виду матеріалу відповідностей між словами та граматичними явищами різних мов. У наш час є достатньо широкий вибір програм, які полегшують працю перекладача, котрі умовно можна підрозділити на дві основні групи: електроні словники (electronic dictionary) та системи машинного перекладу (machine translation system). Системи машинного перекладу забезпечують послідовний переклад текстів, що враховує морфологічні, синтаксичні та семантичні зв’язки членів речення.
Програми перекладу (системи машинного перекладу) з'явилися у відповідь на потреби користувачів в оперативному перекладі різної комерційної, технічної або Інтернет - інформації, яка подана в електронному вигляді. Аналізуючи програми машинного перекладу, потрібно відразу зазначити, що вимоги до них не повинні бути такими ж, як і до перекладу, який виконує людина. Сьогодні програми - перекладачі вміють будувати осмислені фрази, й за останні декілька років якість перекладу поліпшилася.
Створення документів іноземними мовами • фальшиві (підроблені), в яких зміст чи оформлення не відповідає істині.
За стадіями виготовлення розрізняють та¬кі документи: • оригінали - перші або єдині примірники офіційних документів; • копії - документи, в яких точно відтворено інформацію інших документів, а також усі їхні зовнішні ознаки чи частину їх і від¬повідним чином оформлені. Існують такі різновиди копій: • відпуск (повна копія вихідного документа, виготовлена водночас з ори¬гіналом через копіювальний папір); • витяг (копія офіційного до¬кумента, що відтворює певну його частину і відповідно засвідчена); • дублікат (повторний примірник документа, який має юридичну силу оригіналу). Створюючи документ іноземною мовою, реквізити бланка (у межах площі, відведеної формуляром-зразком) треба продублювати цією мовою. На бланках з кутовим розташуванням реквізитів спочатку друкують реквізити 6-9 державною мовою, а нижче - іно¬земною. На бланках з поздовжнім розташуванням реквізитів зазначені реквізити друкують ліворуч державною мовою, а право¬руч - іноземною
[b]Оптичне розпізнавання тексту (англ. optical character recognition, OCR) — це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі. Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на веб-сторінці. Оптичне розпізнавання тексту дозволяє редагувати текст, здійснювати пошук слова або фрази, зберігати його в компактнішій формі, демонструвати або роздруковувати матеріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тексту електронний переклад, форматування або перетворення в мовлення. Оптичне розпізнавання тексту є досліджуваною проблемою в галузях розпізнавання образів, штучного інтелекту і комп’ютерного зору.
Системи оптичного розпізнавання тексту вимагають калібрування для роботи з конкретним шрифтом; у ранніх версіях, для програмування було необхідно зображення кожного символу, програма одночасно могла працювати тільки з одним шрифтом. Зараз найпоширеніші, так звані, «інтелектуальні» системи, що розпізнають більшість шрифтів із високим ступенем точності. Деякі системи оптичного розпізнавання тексту здатні відновлювати вихідне форматування тексту, включаючи зображення, колонки й інші нетекстові компоненти.
Cтворення документів іноземними мовами Діловодство — це діяльність, яка охоплює питання документування та організації роботи з документами в процесі управлінської діяльності.
Особливості сучасного діловодства полягають, насамперед, у переведенні його на державну мову, широкому застосуванні комп'ютерних систем оброблення та друкування документів, необхідності дотримання вимог чинних державних стандартів у цій галузі, впровадження раціональних прийомів роботи.
тому,створюючи документ іноземною мовою,требаа пам'я тати такі правила: реквізити бланка (у межах площі, відведеної формуляром-зразком) треба продублювати іноземною мовою, що ви обрали. На бланках з кутовим розташуванням реквізитів спочатку друкують реквізити 6—9 державною мовою, а нижче — іноземною. На бланках з поздовжнім розташуванням реквізитів зазначені реквізити друкують ліворуч державною мовою, а праворуч — іноземною.
автоматичний переклад документів з використанням програм-перекладачів Програма PROMT
Цю програму (її більш ранні версії відомо під назвою Stylus) розроблено російською фірмою PROMT. Програма є додатком до операційних систем, таких як Windows 95, 98, NT 4.0, 2000 і може бути інтегрована в комплект програм Microsoft Office, зокрема, у програми Microsoft Word та Excel.
Можливості програми PROMT:
- забезпечення перекладу документів з англійської, німецької та французької мов на російську і навпаки;
- до неї можна підключати кілька десятків спеціалізованих словників, що забезпечує правильний переклад термінів, які стосуються певної області знань;
- динамічне відслідковування напрямку перекладу, тобто визначення мови оригіналу і перекладу;
- переклад вмісту буфера обміну, поточного параграфа, виділеного фрагмента тексту або всього тексту;
- забезпечення будь-якого з можливих напрямків перекладу, підключення й відключення словників, доповнення та виправлення їх, складання списку зарезервованих слів, які не перекладаються;
- робота безпосередньо з програмами розпізнавання текстів, наприклад, FineReader;
- не виходячи з програми можна використати відомі способи редагування й форматування оригіналу та перекладу;
- забезпечення перевірки орфографії оригіналу і перекладу після встановлення прикладних програм для перевірки правопису (LingvoCorrector, Пропис, Орфо, Hugo).
Автоматичний переклад документів з використанням програм-перекладачів В наш час,широко відомі приклади невдалих перекладів, що приводять до забавним результатами. Кожен, хто спробує скористатися програмоюавтоматизованого перекладу, отримає приклади різноманітних курйозів вже в перші хвилини роботи. До цього треба ставитися спокійно. Треба розуміти, що казуси неминучі, незалежно від того, яка програма використовується.
Ось деякі відомі вирази, перекладені з російської на англійську. Отриманий результат переведений назад, з англійської на російську. Спробуйте відновити вихідну фразу.
На злодії опіки кепки. Скільки подачі вовка, він все в дерев'яних поглядах. Міра сім разів, один - відключений. На Ярді суду трава, на траві обстрілює деревину. До ворону, оскільки бог послав сектор сиру. Робота не вовк, в деревині не буде виходити. Там не невідомих слідах доріжок безпрецедентних тварин. Засоби автоматичного перекладу
Програмні засоби автоматичного перекладу можна умовно розбити на дві основні категорії. Першу категорію представляють комп'ютерні словники. Призначення комп'ютерних словників те ж, що й у звичайних словників: надати значення невідомого слова.
Перевага комп'ютерних словників складається у швидкості доступу та зручність автоматичного пошуку значення виділеного слова. Автоматичний словник звичайно надає можливість перекладу слова після натискання виділеної комбінації клавіш.
До другої категорії відносяться програми, що дозволяють виконати автоматичний переклад зв'язного тексту. Вони беруть текст на одній мові (імовірно грамотний і не містить помилок) і видають текст на іншій мові. В ході роботи програма використовує великі словники, набори граматичних правил і інші засоби, що забезпечують найкраще (з точки зору програми) якість перекладу. Словник може містити не тільки окремі слова, а й типові словосполучення.
системи оптичного розпізнавання сканованого тексту ABBYY— російська ІТ-компанія, один з провідних світових розробників технологій оптичного розпізнавання документів та лінгвістичного програмного забезпечення. Штаб-квартира ABBYY знаходиться у Москві, де й здійснюється розробка технологій і програмних продуктів компанії. Регіональні офіси ABBYY розташовані в Росії, Україні, Німеччині, США, Великобританії, Японії та Тайвані. На даний час в групі компаній ABBYY працює понад 900 чоловік.
Найбільш відомі продути ABBYY — система сканування та оптичного розпізнавання симоволів ABBYY FineReader, а також сімейство електронних словників ABBYY Lingvo.
За підрахунками аналітиків компанії, станом на 2009 рік, програмами компанії користувалося близько 30 млн. чоловік.
Офіційно оборот компанії не розголошується, але окремі експерти оцінюють його приблизно в $100 млн.[size=13][r][size=10]
Автоматичний переклад документів з використанням програм-перекладачів Ідея автоматичного перекладу текстів з однієї мови на іншу витає в повітрі з часу появи перших комп'ютерів. Якби повноцінний переклад був можливий, значно спростилося б спілкування між народами і обмін документами, але це дуже складне завдання, про повне вирішення якої поки що не доводиться говорити.
Все впирається в обсяг тексту, що перекладається. Комп'ютеризований словник цілком може впоратися з перекладом окремих слів, особливо якщо він може запропонувати декілька значень на вибір. Однак ситуація помітно ускладнюється, коли ми переходимо до переводу цілих фраз і, тим більше, абзаців зв'язного тексту.
Для таких випадків надійного алгоритму перекладу з однієї мови на іншу не існує. Це пов'язано з тим, що кожна фраза мови має два рівні: синтаксичний та смисловий. Синтаксичний рівень визначає побудову речення, а смисловий - його зміст. Для правильного смислового перекладу, необхідно брати до уваги не тільки конкретну фразу, але і абзац або навіть цілий розділ тексту. Таким чином, розраховувати на те, що при автоматичному перекладі вийде повноцінний документ, не можна.
Програми автоматичного перекладу розраховані, в першу чергу, на тих, хто зовсім не знає відповідної іноземної мови, але повинен ознайомитися із змістом документа хоча б приблизно. Крім того, подібні програми дозволяють готувати короткі повідомлення електронної пошти на іноземній мові. Такі повідомлення важко вважати грамотними, але, швидше за все, кореспондент зуміє зрозуміти, що йому хотіли повідомити.
Висновок: якщо немає ніяких вимог до якості перекладу тексту з іноземної мови на російську, то програми автоматичного перекладу можна розглядати як зручні засоби отримання найпростішого чернетки. Якщо подібні вимоги є, то використовувати подібні програми не рекомендується. Кваліфіковане редагування тексту, отриманого автоматичним шляхом, обходиться в кілька разів дорожче, ніж послуги фахівців-перекладачів.
Cтворення документів іноземними мовами; За походженням документи поділяють на: • службові, що стосуються діяльності підприємства (організації, установи, фірми); • офіційно-особисті, які стосуються конкретних осіб, тобто іменні (скарги, заяви тощо). За гласністю документи бувають: • звичайні, • для службового користування (ДСК); • таємні; • конфіденційні та ін.
Створюючи документіноземною мовою, реквізити бланка (у межах площі, відведеної формуляром-зразком) треба продублювати цією мовою. На бланках з кутовим розташуванням реквізитів спочатку друкують реквізити 6—9 державною мовою, а нижче — іно¬земною . На бланках з поздовжнім розташуванням реквізитів зазначені реквізити друкують ліворуч державною мовою, а право¬руч — іноземною .
[size=7]Системи оптичного розпізнавання символі[/size]в (Optical Character Recognition чи, OCR-системы) призначені для автоматичного введення документів в пам'ять комп'ютера. За нікчемний по історичних мірках відрізок часу ці системи вийшли із стадії експериментальних випробувань і перетворилися на один з самих квапних в комерційному відношенні клас програмних продуктів. Зараз OCR-системы успішно справляються з обробкою друкарських документів. Завдання розпізнавання рукописних символів вирішується тільки в декількох окремих випадках. Розпізнавання символів - це складна проблема, яка вимагає для свого вирішення залучення новітніх методів дискретної математики і штучного інтелекту. Вона не вирішується простими переборнимі алгоритмами. Складність реалізації не стала непереборною перешкодою для розробників; на ринку програмних продуктів пропонується декілька систем автоматичного розпізнавання зразково рівного класу, що володіють схожими функціональними можливостями. За кордоном набули найбільшого поширення програми Omnipage, Presto!, OCR Pro. Непоганою функціональністю володіють системи Textbridge і Cuneiform. У наший країні найпопулярнішою є програмаFinereader, розроблена фірмою ABBYY. Finereader - це програма-поліглот, розробники ввели в її склад засоби розпізнавання текстів, написаних на найпоширеніших мовах миру. Вона майже не знає шрифтових обмежень, в середовищі програми можуть бути успішно оброблені тексти, набрані найрізноманітнішими шрифтовими гарнітурами.