Речове розпізнавання за допомогою нейронних мереж (ID:193646)
Зміст
ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ, СКОРОЧЕНЬ, ТЕРМІНІВ 7
ВСТУП 8
РОЗДІЛ 1 ДОЦІЛЬНІСТЬ РЕЧОВОГО РОЗПІЗНАВАННЯ 10
1.1. Завдання розпізнавання мовлення 11
1.1.1. Мобільний зв’язок 11
1.1.2. Управління дорожнім рухом 13
1.1.3. Медицина 15
1.1.4. Охоронна сфера та військова діяльність 17
1.2. Якість розпізнавання 18
1.2.1. Показники розбірливості мови 18
1.2.2. Викривлення при передачі 19
1.2.3. Сучасні засоби розпізнавання 20
1.3. Завдання та етапи розроблення програмного засобу 22
1.4. Висновки до розділу 26
РОЗДІЛ 2 РОЗПІЗНАВАННЯ НЕЙРОМЕРЕЖЕВИМИ ТЕХНОЛОГІЯМИ 28
2.1. Нейромережеві технології 28
2.1.1. Прямого розповсюдження 28
2.1.2. Зворотнього розповсюдження 29
2.2. Аналіз застосованості до розпізнавання мовлення 32
2.3. Модель застосування нейромережі 37
2.4. Висновки до розділу 43
РОЗДІЛ 3 РЕАЛІЗАЦІЯ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ 45
3.1. UML-моделювання програмного засобу 45
3.1.1. Use-case діаграма програмного засобу 45
3.1.2. Діаграма класів 49
3.1.3. Діаграма компонентів 51
3.2. Розробка програмного коду 53
3.3. Оцінювання програмного коду 57
3.3.1. Верифікація 57
3.3.2. Оцінювання на основі метрик Чидамбера та Кемерера 61
3.3.3. Надійність програмного коду 65
3.4. Висновки до розділу 68
ВИCНОВКИ 70
CПИCОК ВИКОРИCТАНИХ ДЖЕРЕЛ 74
ДОДАТОК А 76
Зразок роботи
Розроблена система є актуальною, адже вона надає можливість розпізнавати голос та розшифровувати його маючи всього лише ЕОМ та компілятор.
Система речевого розпізнвання реалізовується за допомогою програмного комплексу модулів та мікрофону. В інтересах розробленого проекту було проведено дослідження в якому було проаналізовано існуючі нейронні мережі. Змодельовано наступні діаграми: класів, компонентів, прецедентів за прямої необхідності цих діаграм при розробці програмної логіки. Хоча в наш час практично всі програмні модулі та бібліотеки вже існують, для моделювання обраної нейронної мережі потрібно створювати свою програмну логіку.
Проектовану систему запропоновано розробити за допомогою Python. Цей продукт дозволяє поєднати різноманітні програмні технології та необхідні бібліотеки: PyBrain, Matplotlip, NumPy, SciPy, Pandas.
Ця тематика дипломного проекту відповідає цілям та завданням кафедри, щодо розробки фахівців в галузі системного програмування та включає знання з пройдених дисциплін.
Мета дипломного проекту – чітке та коректне розрізнавання голосу за допомогою програмного комплексу, використання новітніх технологій, моделювання підходящої нейронної мережі. Для досягнення визначеної мети ставляться такі завдання:
– знайти або створити необхідний набір даних;
– змоделювати нейронну мережу;
– реалізувати програмну логіку системи.
Об’єкт дослідження – методи та засоби речового розпізнавання для обслуговування користувачів.
Предмет дослідження – прототип системи розпізнавання голосу, який включає: модуль розпізнавання, нейронну мережу та блок логіки.
Метод дослідження – аналіз можливих використань нейронної мережі, вибір підходящої нейронної мережі та побудова нейронної мережі.
Новизна отриманих результатів – використано унікальний стек технологій, створенно нейронну мережу для аналізу запропонованих даних.
Матеріали дипломного проекту рекомендуються використовувати в медичних та військових цілях при обслуговуванні користувачів та у навчальному процесі.
Розроблено особисто. Діаграму класів, діаграму компонентів, діаграму прецедентів, алгоритм роботи системи розпізнавання голосу, програмний код, проведено тестування.
Практичне значення результатів дає змогу користувачам розробленої системи, розпізнавати голос на основі спектральних частин.
Потенціал систем розпізнавання голосу для світового ринку важко переоцінити. Використання концепції дозволяє не тільки відображати текст який було сказано в мікрофом, а й в майбутньому робити моментальний перевод на іншу мови.
При виборі теми дипломного проекту, було обрано сам цю. Так як, запропонована розробка дасть змогу не тільки показати свох навички, а й розібратися в одній з найбільш актуальних тем сьогодення.
Інші роботи з даної категорії: