Дослідження засобів контролю присутності запозичень у текстових документах та створення програмного забезпечення для електронних бібліотек регіональних навчальних закладів

Проблема порушення авторських прав в Інтернеті. Системи та сервіси пошуку плагіату. Захист електронних видань від плагіату в Інтернеті. Алгоритми аналізу, подання і порівняння текстової інформації. Вибір методу пошуку текстових документів з запозиченнями.

Рубрика Программирование, компьютеры и кибернетика
Вид магистерская работа
Язык украинский
Дата добавления 14.06.2013
Размер файла 1,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Природне освітлення повинно здійснюватися через світлові отвори орієнтовані переважно на північ і північний схід і забезпечувати коефіцієнт природної освітленості не нижче 1,2% у зонах зі стійким сніговим покривом і не нижче 1,5% на решті території. Розташування робочих місць з ПЕОМ в підвальних приміщеннях не допускається.

Штучне освітлення в приміщеннях експлуатації ПЕОМ повинне здійснюватися системою загального рівномірного освітлення. Допускається установка світильників місцевого освітлення для підсвічування документів. Воно неповинне створювати відблисків на поверхні екрану.

Як джерела світла при штучному освітленні рекомендується застосовувати люмінесцентні лампи типу ЛБ зі світильниками серії ЛПО36 з зеркалізованими гратами. Лампи розжарювання краще використовувати для місцевого освітлення зони робочого документа (клавіатури, книги, зошити).

У полі зору оператора повинна бути відсутнім прямі і відбиті відблиски. Для зниження відблисків необхідно:

використовувати для загального освітлення світильники з розсіювачами і екранують гратами, яскравість яких у зоні кутів випромінювання більш 50 градусів від вертикалі не повинно перевищувати 200 кд/м2;

використовувати для місцевого освітлення світильники з непросвічуючими відбивачами і захисним кутом не менше 40 градусів;

розміщувати робочий стіл так, щоб віконний проріз знаходився збоку

(краще ліворуч). При цьому дисплей повинен розташовуватися на поверхні столу праворуч або ліворуч від оператора;

розміщувати робочий стіл між рядами світильників загального освітлення;

використовувати дисплей, що має антиблікове покриття екрану або антибликовий фільтр.

Умови зовнішнього освітлення часто впливають на оцінку якості передачі кольору та інших параметрів відображення. Багато виробників, такі як Mitsubishi і Panasonic, борються із зовнішніми факторами, зменшуючи кривизну екрану, аж до створення абсолютно плоских екранів [17]. За даними Panasonic, в моделі PanaFlat PF70, що випускається цією компанією, відблиски в порівнянні з звичайними кінескопними зменшені на 87%. Є також ряд інших засобів, що дозволяють боротися із зовнішнім світом, - спеціальні багатошарові покриття і капюшони, такі як поставляються з моделями серії Electron компанії LaCie.

Умови роботи за монітором протилежні тим, які звичні для наших очей. У звичайному житті ми сприймаємо в основному відображене світло (якщо тільки не дивимося на сонце, зірки або штучні джерела освітлення), а об'єкти спостереження безперервно перебувають у полі нашого зору протягом хоча б декількох секунд. А от при роботі за монітором ми маємо справу з самосвітним об'єктами і дискретним (мерехтливим з великою частотою) зображенням, що збільшує навантаження на очі. Таким чином, характерною особливістю праці за комп'ютером є необхідність виконання точних зорових робіт на світному екрані в умовах перепаду яркостей в поле зору, наявність мигтіння, нестійкості і нечіткості зображення. Об'єкти зорової роботи знаходяться на різній відстані від очей користувача (від 30 до 70 см) і доводиться часто переводити погляд у напрямках екран - клавіатура - документація (згідно хронометражних даними від 15 до 50 разів на хвилину). Часта переадаптація очі до різних яскравість і відстаней є одним із головних негативних чинників при роботі з дисплеями. Несприятливим фактором світлового середовища є невідповідність нормативним значенням рівнів освітленості робочих поверхонь столу, екрану, клавіатури. Нерідко на екранах спостерігається дзеркальне відображення джерел світла та оточуючих предметів. Всі вище викладене ускладнює роботу і призводить до порушень основних функцій зорової системи. Відзначається швидке стомлення і затуманення зору, двоїння предметів. Комплекс виявлення порушень був охарактеризований фахівцями як "професійна офтальмопатія" або астенопія - суб'єктивні зорові симптоми дискомфорту або емоційний дискомфорт, що є результатом зорової діяльності.

Частота прояву астенопії залежить від робочої ситуації, тривалості роботи за екраном і наявності у користувача порушень зору, очних хвороб чи спадкової схильності до таких. Зокрема, після досягнення 40-річного віку оператори повинні регулярно проходити офтальмологічне обстеження з огляду на ймовірності появи пресбіопії - старечої далекозорості, що сприяє виникненню або посилення зорового дискомфорту. Що стосується ризику появи міопії - короткозорості, то при дотриманні режиму праці та відпочинку вона, як правило, може виникнути або посилитися тільки в людей, спочатку до неї схильні.

Яскравість зображення (мається на увазі яскравість світлих елементів, тобто знака для негативного зображення та фону для позитивного) нормується для того, щоб полегшити пристосування ока до самосвітних об'єктів.

Обмежено також (у межах 25%) і коливання яскравості. Дослідження показали [4], що при більш високих рівнях освітленості екрану зорова система втомлюється швидше і більшою мірою.

До цих пір залишається спірним питання про те, що краще для зору: позитивне зображення (світлий екран і темні символи) або, навпаки, негативне зображення. І для того і для іншого варіанту можна привести доводи за і проти. Гігієністи вважають, однак, що якщо робота з ПЕОМ припускає одночасно і роботу з паперовим носієм - зошит, книга (тобто доводиться поперемінно дивитися на ділянки з позитивною і негативної полярністю), то краще і на екрані монітора мати темні символи на світлому фоні, щоб очам не доводилося постійно перебудовуватися. При виборі колірної гами перевагу слід віддавати зелено-блакитний частини спектру. Опитування серед студентів Московської медичної академії імені І.М. Сеченова, показало, що 66% користувачів віддають перевагу для тривалої роботи з відеотерміналом позитивному зображенню, в основному варіант "блакитний екран - чорні символи".

Досить часто чинником, що сприяє швидкого стомлення очей, стає і контраст між фоном і символами на екрані [8]. Зрозуміло, що мала контрастність ускладнює розрізнення символів, однак і занадто велика теж шкодить. Тому контраст повинен бути в межах від 3: 1 до 1,5:

1. Прибільш низьких рівнях контрастності у працюючих швидше наступали несприятливі зміни здатності фокусувати зображення і критичної частоти злиття світлового мигтіння, реєструвалося більше скарг на втому очей і загальну втому.

Гігієністами зазначено [12], що читання, в першу чергу у дітей, значно ускладнено і швидко приводить до стомлення, якщо літери мають незвичні химерні обриси. З цієї причини лікарі без ентузіазму відносяться до повального захоплення різноманітними шрифтами, особливо в освітні програми для дітей. Дослідження зору у школярів початкових класів показали, що при читанні тексту, набраного шрифтом більше складного малюнка, у дітей швидше падає швидкість читання, частіше відзначається зниження критичної частоти злиття світлового мелькання. ДСанПіН 3.3.2.007-1998 включає декілька параметрів, що визначають допустиму форму і розміри знака [3]. Зокрема, нормується відношення ширини знака до висоти (0,5-1,0, краще 0,7 - 0,9), тобто знаки не повинні бути ні занадто вузькими, ні занадто широкими.

Легкість для читання знижується, якщо растр зображення видно; збільшення матриці знака до 7 (9) підвищує легкість для читання. Оптимальна величина знаків диктується як достатніми для ідентифікації розмірами, так і тим, що знаки не повинні бути дуже великими, інакше при читанні занадто мало знаків потрапляє в поле зору. Оскільки яскравість, в принципі, змінюється при кожному пробігу скануючого променя, чіткість символів визначається крутизною зміни яскравості при перетині контуру символу.

Відбивна здатність екрану не повинна перевищувати 1%. Для зниження кількості відблисків і полегшення концентрації уваги корпус монітора повинен мати матову одноколірну поверхню (світло-сірий, світло-бежевий тону) з коефіцієнтом відображення 0,4 (0,6, без блискучих деталей і з мінімальним числом органів управління і написи на лицьовій стороні. Антиблікове покриття зменшує віддзеркалення зовнішнього світла від скляної поверхні екрану. Розрізняють декілька типів покриття: наприклад, спеціальне розсіююче світловий потік, гравірування екрану; більш ефективне кремнієве покриття, часто вживане в скляних фільтрах.

Зміна яскравості під час одного циклу регенерації може сприйматися як мерехтіння. Частота, при якій не спостерігається мерехтінь - частота злиття мерехтінь. Сприйняття мерехтіння залежить не тільки від частоти регенерації, але від низки інших параметрів, таких як яскравість екрана, освітленість приміщення, ступінь осциляції, контраст, а також від використання центрального чи периферичного зору і від індивідуальної чутливості. Мерехтіння негативно впливає на зоровий комфорт оператора і може викликати симптоми зорового стомлення. Оскільки сітківка ока змушена постійно перенастроюватися, видимі мерехтіння сприяють виникненню адаптаційної перевантаженню очей.

Деякі види люмінофора мають значну після свічення, тобто яскравість символів знижується дуже повільно, і вони сприймаються протягом декількох періодів регенерації після того, як відповідні пікселі вже більше не опромінюються. Таке явище значно знижує чіткість зображення; на моніторах з швидкими люмінофорами воно не спостерігається.

Допускається встановлення світильників місцевого освітлення для підсвічування документів. Місцеве освітлення не повинно створювати відблисків на поверхні екрану і збільшувати освітленість екрана понад 300 люкс. Дослідження фізіологів і гігієністів [7] переконливо довели, що і півтемрява, і занадто висока освітленість екрану призводять до швидкого зорового стомлення.

Екран відеомонітора повинен знаходиться від очей оператора на оптимальному відстані 600 - 700 мм, але не ближче 500 мм з урахуванням розмірів алфавітно-цифрових знаків і символів. Рівень очей при вертикальному розташуванні екрану ПЕОМ має припадати на центр або 2/3 висоти екрана. Лінія погляду повинна бути перпендикулярна центру екрана і оптимальне її відхилення від перпендикуляра, що проходить через центр екрану у вертикальній площині, не повинно перевищувати плюс-мінус 5 градусів (допустимий плюс-мінус 10 градусів).

Для захисту від прямих сонячних променів повинні передбачатися сонцезахисні пристрої (плівки з металізованим покриттям, жалюзі з вертикальними ламелями). Операторам і користувачам рекомендується видавати такі засоби захисту як комп'ютерні окуляри, захисні екрани "повний захист", що пройшли випробування в акредитованих лабораторіях і мають відповідний гігієнічний сертифікат.

У випадках виникнення у працюючих з ПЕОМ зорового дискомфорту, незважаючи на дотримання санітарно - гігієнічних, ергономічних вимог, режимів праці та відпочинку слід застосовувати індивідуальний підхід в обмеження часу роботи з ПЕОМ, корекцію тривалості перерв для відпочинку або проводити зміну діяльності на іншу.

Під час роботи з метою забезпечення працездатності та збереження здоров'я слід робити регламентовані перерви [14]. Під час регламентованих перерв з метою зниження нервово-емоційної напруги, стомлення зорового аналізатора, доцільно виконувати комплекси вправ для очей. Вправи виконуються сидячи або стоячи, відвернувшись від екрану при ритмічному диханні, з максимальною амплітудою руху очей.

1. Закрити очі, сильно напружуючи м'язи очей, на рахунок 1-4, потім розкрити очі, розслабивши м'язи очей, подивитися в далечінь на рахунок 1 - 6, (повторити 4-5 разів).

2. Подивитись на перенісся і затримати погляд на рахунок 1-4. До втоми очі не доводити. Потім відкрити очі, подивитися вдалину на рахунок 1-6, (повторити 4-5 разів).

3. Не повертаючи голови, подивитись направо і зафіксувати погляд на рахунок 1-4, потім подивитися в далечінь прямо на рахунок 1-6. Аналогічним чином проводяться вправи, але з фіксацією погляду вліво, вгору і вниз, (повторити 3-4 рази).

4. Перенести погляд швидко по діагоналі: направо вгору - наліво вниз, потім прямо вдалину на рахунок 1-6, потім ліворуч-вгору - праворуч-вниз і подивитися вдалину на рахунок 1-6, (повторити 4-5 разів).

Висновки. У результаті виконаного дослідження виявлено, що комп'ютерні технології, будучи великим досягнення людства, мають негативні наслідки для здоров'я людей.

Так, при регулярній роботі за комп'ютером слід обзавестися екраном з високим ступенем дозволу зображення. Більше пікселів - краще для зору. Текст повинен мати хорошу контрастність, чорним по білому - залишається гарним вибором. Необхідно уникати темного фону. Встановлювати, як найменший за розміром шрифт, який можна прочитати. Робочий шрифт робити в 3 рази більше. Якщо для роботи не потрібно розрізнення кольорів, оптимальною є праця за чорно-білим монітором. Для кольорових моніторів крок апертурних граток бажано мати менше 0,28 мм. Підібрати оптимальний рівень контрасту, щоб букви було видно максимально чітко.

Для зниження збитку здоров'ю необхідне дотримання встановлених гігієнічних вимог до режимів праці та організації робочих місць. Гігієністами і фізіологами проведено безліч експериментів з вивчення працездатності, виявлення причин стомлення і виникнення патологічних відхилень у працюючих за ПЕОМ. Результати цих експериментів використовуються при розробці оптимальних режимів роботи.

Отже, працювати за комп'ютером можна. Але, щоб запобігти передчасному виходу з ладу свого організму, потрібні деякі знання і вольові зусилля.

Висновки

В процесі магістерської роботи на тему "Дослідження засобів контролю присутності запозичень у текстових документах та створення програмного забезпечення для електронних бібліотек регіональних навчальних закладів" були вивчені і закріплені на практиці отримані навички за курс навчання.

Ціль яку було поставлено на початку роботи, а саме дослідження систем, методів і алгоритмів, що дозволяють проводити пошук запозичень в текстовій інформації було виконано. В ході якої було розроблене програмне забезпечення для пошуку запозичень в текстових документах розміщених в електронній бібліотеці регіональних навчальних закладах. Для досягнення мети були вирішені наступні завдання:

огляд програмних систем, що дозволяють проводити пошук запозичень в мережі Інтернет;

розробка методів і алгоритмів, що дозволяють здійснювати пошук запозичень в ЕВ;

програмна реалізація розроблених і запропонованих методів і алгоритмів пошуку запозичень в ЕВ;

Дана програма призначена для зручного користування всіма користувачами. Дозволяє ефективно знаходити запозичення в тексті.

Закріплення теоретичного матеріалу відбувається в ході вирішення поставленої задачі, розробка програми, тестування і відкладання системи.

Завершення магістерської роботи стало написання пояснювальної записки, при написанні якої, також були закріплені основні знання з написання звітів.

Список літератури

1. Бах А.О. Разработка эффективных алгоритмов поиска слов в текстах для построения методов сжатия данных. Диссертационная работа к. т. н.: 05.13.13, Новосибирск - 2002. - 214 с.

2. Гасов В.М., Крутояров Д. В, Метод сравнения текстовых документов, позволяющий выявлять совпадающие фрагменты // Проблемы полиграфии и издательского дела. - 2006 №4 - с, 92-104.

3. Гигиенические требования к видеодисплейным терминалам, ПЭВМ и организация работы. Санитарные нормы и правила / Госкомсанэпидемнадзор России. - М., 1996.

4. Горшков С.И. и др. Методика исследований в физиологии труда. - М.: Медицина, 1974. - 312 с.

5. Демирчоглян Г.Г. Дисплей: зрение и поза оператора // Вычислительная техника. - 1990. - № 3.

6. ДСанПіН 3.3.2.007-1998. Державні санітарні правила і норми роботи з візуальними дисплейними терміналами електронно-обчислювальних машин.

7. Ермаков А.Е. Проблемы полнотекстового поиска и их решение. // Мир ПК., №5, 2001

8. Касьянов Н.А., Харьковский Б.Т. Охрана труда пользователей персональных компьютеров: Учебн. пособие. - Луганск: Изд-во ВНУ, 1999 -

9. Крутояров Д.В. Автоматизированная система сравнения электронных изданий, опубликованных в сети Internet/Intranet // Вестник МГУП. - 2005 №11 (дополнительный). - с.84-87

10. Крутояров Д.В. О выборе метода анализа текстовой информации // Проблемы полиграфии и издательского дела. - 2006 .3. - с.175 - 178

11. Леонтьев К.Б. Проблемы развития авторского права в современных технологических условиях. Диссертационная работа к. ю. н.: 12.00.03 - М., 2003. - 207 с.

12. Методические указания по профилактике переутомления студентов вузов при работе с видеотерминалами №4563-88. - М.: Минздрав СССР, 1988.

13. Мэгдайниер С. Защита интеллектуальной собственности на документы Б системе WWW.[Электронный ресурс]. - Электрон, дан. - Режим доступа: http://capri. ustu.ru/

14. Правила охорони праці при експлуатації електронно-обчислювальних машин. №382/3675 від 17.06.1999.

15. Погуляев В.В., Тулубьева Н.Ю. Нарушение авторских прав в сети Интернет. [Электронный ресурс]. - Электрон, дан. - Режим доступа: http://www.iuragent.ru

16. Федоренко Д.В. Автоматизированная система сравнения электронных изданий, опубликованных в сети Internet/Intranet // Вестник МГУП. - 2004 №5. - с.74-78

17. MPR 1990: 10 (MPR 11) Справочное руководство пользователя для оценки качества дисплеев. Шведский национальный комитет по измерениям и испытаниям (The National Board of Meggurement and Testing).

Додаток Б

Лістинг програми

<?

class Shingler

{

var $length;

var $stopSymbols = array (". ",",","!","?",": ","; ","-","n","r"," (",")");

var $stopWords = array ('это', 'как', 'так', 'и', 'в', 'над', 'к', 'до', 'не', 'на', 'но', 'за', 'то', 'с', 'ли', 'а', 'во', 'от', 'со', 'для', 'о', 'же', 'ну', 'вы', 'бы', 'что', 'кто', 'он', 'она');

function Shingler ($length, $stopSymbols = false, $stopWords = false)

{

$this->length = $length;

if ($stopSymbols! = false)

$this->stopSymbols = $stopSymbols;

if ($stopWords! = false)

$this->stopWords = $stopWords;

}

function setStopWords ($stopWords)

{

$this->stopWords = $stopWords;

}

function getStopWords ()

{

return $this->stopWords;

}

function setStopSymbols ($stopSymbols)

{

$this->stopSymbols = $stopSymbols;

}

function getStopSymbols ()

{

return $this->stopSymbols;

}

function compare ($textA, $textB)

{

$shinglesA = $this->shingle ($this->canonize ($textA));

$shinglesB = $this->shingle ($this->canonize ($textB));

$matches = 0;

foreach ($shinglesA as $shingle)

{

if (in_array ($shingle, $shinglesB))

$matches++;

}

return 2 * 100 * $matches / (count ($shinglesA) + count ($shinglesB));

}

function canonize ($text)

{

$text = str_replace ($this->stopSymbols, null, $text);

$text = strtolower (eregi_replace (" +", "", $text));

$words = explode ("", $text);

foreach ($words as $i => $word)

{

if (in_array (strtolower ($word), $this->stopWords))

$words = array_remove ($word, $words);

}

return implode ("", $words);

}

function shingle ($text)

{

$result = array ();

$words = explode ("", $text);

for ($i = 0; $i <= count ($words) - $this->length; $i++)

{

$currentShingle = array ();

for ($j = 0; $j < $this->length; $j++)

{

array_push ($currentShingle, $words [$i + $j]);

}

$shingledText = implode ("", $currentShingle);

array_push ($result, crc32 ($shingledText));

}

return $result;

}

}

function array_remove ($val, &$arr)

{

$result = $arr;

for ($x = 0; $x < count ($result); $x++)

{

$i = array_search ($val, $result);

if (is_numeric ($i))

{

$left = array_slice ($result, 0, $i);

$right = array_slice ($result, $i + 1, count ($result) - 1);

$result = array_merge ($left, $right);

}

}

return $result;

}

$textA = " ";

$textB = " ";

$shingler = new Shingler (10);

echo $shingler->compare ($textA, $textB);

? >

Размещено на Allbest.ru


Подобные документы

  • Принципи побудови захисту електронних банківських документів. Забезпечення автентифікації адресата та відправника міжбанківських електронних розрахункових документів і службових повідомлень. Апаратно-програмні засоби криптографічного захисту інформації.

    контрольная работа [54,9 K], добавлен 26.07.2009

  • Вивчення існуючих систем по виявленню плагіату. Алгоритм створення системи для виявлення плагіату, в базі якої будуть зберігатися всі лабораторні роботи студентів. Проектування програми: побудова uml-діаграм, видалення коментарів в коді, опис архітектури.

    дипломная работа [4,1 M], добавлен 09.06.2012

  • Методи результативного пошуку інформації в Інтернеті. Уявлення про пошукові служби, їх призначення та структура. Основні типи пошукових служб: пошукові каталоги, рейтингові системи, індексні бази даних. Спрямованість тематики і широта охоплення ресурсів.

    реферат [33,5 K], добавлен 23.04.2010

  • Історія розвитку і створення Інтернет. Протоколи передачі даних. Способи організації пошуку інформації Інтернет. Пошукові системи та сервіси: Яндекс, Google, шукалка. Послідовність виконання пошуку необхідної інормації за допомогою браузера Mozilla.

    дипломная работа [4,9 M], добавлен 22.07.2015

  • Опис та порівняння онлайнових електронних перекладних словників ABBYY Lingvo та MultiLex, зручність інтерфейсу, кількість додаткових функцій та сервісів. Головні можливості та порівняння глибини тлумачення електронних онлайнових тлумачних словників.

    курсовая работа [38,5 K], добавлен 22.11.2010

  • Принципові рішення, що покладені в основу концепції створення єдиних реєстрів. Критерії для відбору стратегії пошуку правової інформації в Інтернеті. Модель ділового процесу, її використання у Workflow-системах. Організаційне забезпечення ІС ОВС України.

    контрольная работа [23,3 K], добавлен 20.07.2011

  • Технологія пошуку інформації в мережі Інтернет. Можливості спеціальних служб, індексів. Інформаційні ресурси у каталогах. Системи мета-пошуку, пошуку в конференціях Usenet, пошуку людей. Знаходження інформації із застосуванням серверів глобального пошуку.

    реферат [38,8 K], добавлен 20.05.2011

  • Поняття сайту як системи електронних документів (файлів даних, коду) приватної особи або організації в комп'ютерній мережі. Визначення засобів для створення сторінки в Інтернеті, вимоги до зовнішнього вигляду та функцій. Особливості розробки макету сайту.

    курсовая работа [2,1 M], добавлен 17.12.2015

  • Загальні відомості про текстовий процесор, інтерфейс програми та інсталяція, елементи керування і налаштування панелі швидкого доступу. Робота з документами, введення тексту та відкриття файлів, створення документів, захист і збереження текстових файлів.

    дипломная работа [11,6 M], добавлен 26.05.2012

  • Захист електронних платежів у мережі Іntегnеt. Побудова захисту електронних банківських документів. Криптографічний захист інформації. Захист інформації та вирішення питань безпеки у СЕП. Роботи програмно-технічних комплексів в інформаційній мережі.

    контрольная работа [293,9 K], добавлен 26.07.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.