Зміст
ЗМІСТ
ВСТУП 3
РОЗДІЛ I. ІННОВАЦІЙНІ ТЕХНОЛОГІЇ ОБРОБКИ ВЕЛИКИХ ІНФОРМАЦІЙНИХ МАСИВІВ 7
1.1. Парадигма індустрії Big Data 7
1.2. Поняття та джерела великих даних 15
Висновки до розділу 1 30
РОЗДІЛ II. ВЕЛИКІ ДАНІ НА ПІДПРИЄМСТВАХ 32
2.1. Доступ до великих масивів відомостей 32
2.2. Корпоративні сховища даних 43
Виcновки до роздiлу 2 54
РОЗДІЛ III. ВПРОВАДЖЕННЯ ВЕЛИКИХ ДАНИХ ДЛЯ СЕРЕДНЬОГО І ВЕЛИКОГО БІЗНЕСУ (НА ПРИКЛАДІ МЕРЕЖІ СУПЕРМАРКЕТІВ) 56
3.1. Прикладні рішення для Big Data 56
3.2. Обробка та аналіз великих даних 88
Виcновки до роздiлу 3 107
ВИCНOВКИ 109
СПИСОК ВИИКОРИСТАНИХ ДЖЕРЕЛ 111
ДОДАТКИ 116
ВСТУП
Актуальність теми. Тема Big Data сьогодні набуває особливої актуальності: змінюючи підходи до аналізу інформації і способи прийняття рішень, цей тренд впливає на бізнес усіх розмірів.
Організації та раніше вкладали значні кошти в програми для автоматизації бізнес-процесів і поліпшення операційної ефективності. Багато з цих проектів ще тривають, але стає абсолютно ясно, що управління даними за допомогою традиційних методів не забезпечує правильної інформації в правильний час і її надання правильним співробітникам. Це відбувається з різних причин: через погану інтеграції систем і невисокої якості даних, а також проблем з продуктивністю і масштабованість. Багато організацій сьогодні не можуть впоратися з труднощами отримання даних, необхідних для прийняття критично важливого рішення.
В ІТ-індустрії немає поки загальної домовленості про те, що розуміти під терміном Big Data. Багато хто використовує його для позначення експоненціального зростання даних, проблеми доступності та використання інформації в ІТ-ландшафті завтрашнього дня, якому супроводжує накопичення величезних масивів інформації.
Часто термін Big Data використовується для опису масивних обсягів даних, які аналізуються сверхкомпаніямі зразок Google, Amazon, Facebook або колективами, що працюють над грандіозними науковими проектами, - такими як NASA.
Однак більшість фахівців вважають, що поняття Big Data треба співвідносити нема з об'ємом, а зі швидкістю зростання даних, при якій підприємство не встигає реагувати на виникаючі проблеми. Для більшості корпоративних структур значення терміна BIG щодо: все залежить від розміру організації. Більшою мірою йдеться про пошук нової цінності як усередині традиційних джерел даних, так і за їх межами.
Під Big Data експерти багатьох організацій розуміють обсяги даних, що перевершують на один або кілька порядків звичні масиви, з якими працюють сучасні інформаційні системи. Проблеми Big Data пов'язані з необхідністю обробки постійно і різко збільшуються обсягів інформації, пошуку і класифікації даних в умовах зростання складності і числа їх окремих елементів.
Питання використання великих даних в даний момент розглядається в основному західними фахівцями в силу наявності доступу до емпіричних методів дослідження. Професори Роджер Бон (Bohn Roger) і Джеймс Шорт (James Short) з Каліфорнійського університету Сан Дієго в своїх роботах 2009-2010 років приділили багато уваги накопиченню інформації серед корпорацій та індивідуальних користувачів. У своїх роботах вони розкрили масштаби накопичення інформації в глобальному масштабі, а також роблять прогнози з приводу темпів подальшого зростання обсягу великих даних. У роботі 2011 Ерік Бринжолфссон (Brynjolfsson Eric) і Хіт Лорін (Lorin M. Hitt) підкреслюють збільшення значущості рішень, прийнятих на підставі аналізу даних в компаніях різних секторів економіки. Особливою активністю в питанні дослідження великих даних відзначилися фахівці McKinsey Global Institute (організація, асоційована з міжнародною консалтинговою компанією акКінсі і Ко). У своїх роботах представники інституту Жак Бугін (Bughin, Jaques), Майкл Чиу (Michael Chiu), Джеймс Маніука (James Manyika), Майкл Барбер (Barber, Michael and Lenny Mendoca), Алістер Леві (Alastair Levy), Тімо Кубах (Timo Kubach) і Маркус Лоффлера (Markus Loffler) детально досліджують різноманітні аспекти розвитку і використання великих даних. Зокрема, велику роль у своїх дослідженнях фахівці інституту приділяють потенціалу використання великих даних у державному секторі та секторі роздрібної торгівлі.
Метою дослідження є поглиблення теоретичних і методичних засад та розробка прикладних рекомендацій щодо формування великих даних.
Реалізація мети дослідження зумовила необхідність визначення і розв'язання наступних завдань:
• дослідження теоретичних основ великих даних;
• охарактеризувати методи формування великих даних;
• провести аналіз великих даних на прикладі супермаркету;
• напрями удосконалення роботи з великими даними.
Об’єктом дослідження є великі дані.
Предмет дослідження – обробка та аналіз великих даних на прикладі супермаркету.
Методи дослідження. В процесі дослідження використовувались - загальнонауковий діалектичний, аналітичний, синтетичний, історичний, індуктивний та дедуктивний методи, а також системний підхід.
Інформаційна база дослідження. У роботі використано дані кондитерського відділу супермаркету «Берегиня» та власні розрахунки автора з використанням програмних продуктів Excel2013 і Rules Wizard.
Наукова новизна роботи полягає в тому, що в ній проведено асоціативний аналіз на прикладі кондитерського відділу супермаркету «Берегиня».
Практичне значення одержаних результатів полягає у тому, що супермаркет «Берегиня» може використати наш асоціативний аналіз, для проведення правильного маркетингового рішення, що дасть змогу збільшити об’єми продажу, а відповідно і прибуток магазину.
Структура та обсяг роботи. Дипломна робота складається із вступу, трьох розділів, висновків, списку використаних джерел та додатків. Повний обсяг роботи становить 128 сторінок комп’ютерного тексту, який включає 19 рисунки та 1 таблиць, і 2 додатки на 13 стор. Список використаних джерел із 63.