Програмні засоби для складних обчислень, аналізу даних та фінансових розрахунків.

Урок 15. Програмні засоби для складних обчислень, аналізу даних та фінансових розрахунків.

Аналіз сучасного стану на ринку статистичних пакетів

Аналіз даних є невід’ємною частиною процесу дослідження систем будь-якого типу. На тепер ринок пакетів програм для статистичної обробки даних пропонує велику кількість різноманітних ПЗ . У цьому переліку представлені різноманітні ПЗ від засобів EXCEL до пакету STATISTICA .

Виходячи з поставленого круга завдань науково-дослідницької діяльності, користувачеві кожного разу необхідно обирати оптимальне і відповідне для нього ПЗ - статистичний пакет. Як правило, оптимальним є варіант, що комбінує в собі високий рівень продуктивності ПЗ, потрібні функціональні можливості і помірну ціну.

При виборі важливо звернути увагу на наступні характеристики: відповідність комп’ютерного устаткування користувача системним вимогам ПЗ; відповідність можливостей ПЗ до параметрів поставлених завдань; об’єм даних для статистичного аналізу; кваліфікація (рівень знань) користувача в області статистики.

Статистичний пакет повинен відповідати певним вимогам: модульність; можливість асистування при виборі способу обробки даних; використання простої проблемно-орієнтованої мови для формулювання завдання користувача; автоматична організація процесу обробки даних та зв'язків з модулями пакета; ведення банку даних користувача і складання звіту про результати зробленого аналізу; діалоговий режим роботи користувача з пакетом; сумісність з іншим програмами.

Досвід використання комп’ютерної техніки та програмного забезпечення підтверджує той факт, що практично для кожної науково-досідницької задачі є можливість обрати оптимальний варіант комбінації hardware-software. Можливо використовувати різне ПЗ та різні версії того самого ПЗ з різними системні вимогами на різноманітних апаратних платформах. Крім того, як розвиток software, так і розвиток hardware іде взаємопов’язано і невпинно. Отже, не повинна виникати проблема обрати для своїх досліджень певну систему засобів.

Для досягнення результативності ПЗ повинні також мати можливість внесення доповнень, мати високий рівень сегментації, набір пропонованих методик аналізу і сервісних функцій, мати розвинені засоби налаштувань, зручні функції імпорту даних, а також налаштування на галузеву специфіку.

Найпопулярніші програмні продукти з наявними засобами статистичного аналізу даних

BMDP - BioMeDical Package (Statistical Software, Inc.). BMDP - це статистичний біомедичний пакет і бібліотека із більш ніж сорока статистичних процедур. Забезпечує такі функції: ступенева регресія, всі можливі підмножини регресії, поліноміальна регресія, ступенева логістична регресія, дисперсійний та коваріаційний аналіз.

EViews - Econometric Views (Quantitative Micro Software / IHS Markit Ltd.). Статистичний пакет для аналізу економетричних даних часових рядів, аналізу і моделювання даних, побудови регресійних моделей. EViews - найпотужніший пакет для побудови економетричних моделей. EViews може бути успішно використаний для вирішення наступних завдань: аналіз наукової інформації; фінансовий аналіз; макроекономічне прогнозування; моделювання економічних процесів; прогнозування станів ринків тощо.

GenStat (VSN International Ltd. - VSNi). Програма статистичної обробки даних з широкими можливостями графічного представлення результатів та програмування. ЇЇ особливістю є наявність вже готового набору функцій для аналізу результатів біологічних, фармакологічних і сільськогосподарських експериментів, включаючи microarray аналіз. GenStat є усебічною системою статистики, що пропонує просту систему для недосвідченого користувача через інтерфейс меню Windows, гнучку систему для досвідченішого користувача через потужний інтерфейс з використанням командної мови. Перевагою GenStat є великий діапазон доступних статистичних методів.

GraphPad Prism (GraphPad Software, Inc.). Cпеціалізована програма для статистичного аналізу біологічних даних (біостатистика, побудова кривих і графіків). GraphPad Prism поєднує в собі функції побудови наукових графіків, кривих в нелінійній регресії, отримання зрозумілих статистичних результатів і організацію даних. Розроблена для біологів, соціологів і фізиків, також широко використовується студентами і аспірантами.

Maple (Waterloo Maple, Inc.). Комерційна система комп'ютерної алгебри. Містить понад 5000 функцій для більшості розділів сучасної математики, моделювання та інтерактивної візуалізації, підтримує мову програмування Maple, дозволяє комбінувати алгоритми, результати обчислення, математичні формули, текст, графіку, діаграми та анімацію зі звуком в електронному документі.

MathCAD (Parametric Technology Corp.). Потужний пакет для математичних розрахунків, розв’язання рівнянь, побудови графіків тощо. Є системою комп'ютерної алгебри з класу систем автоматизованого проектування, орієнтована на підготовку інтерактивних документів з обчисленнями і візуальним супроводженням, відрізняється легкістю використання і застосування для колективної роботи. Має простий і інтуїтивний інтерфейс користувача. Для введення формул і даних можна використовувати як клавіатуру, так і спеціальні панелі інструментів. Робота здійснюється в межах робочого аркуша, на якому рівняння і вирази відображаються графічно, на противагу текстовому запису в мовах програмування. Mathcad зручно використовувати для навчання, обчислень і інженерних розрахунків.

Mathematica (Wolfram Research, Inc) — вичерпна система комп'ютерної алгебри для чисельних, символьних та графічних обчислень і візуалізації. Виконує найрізноманітніші математичні операції та перетворення алгебраїчних виразів заданих в чисельній та символьній формах (змінні, функції, поліноми, матриці тощо). Mathematica – це інтерактивний обчислювальний та графічний інструмент із вбудованою мовою програмування для швидких та точних розв’язків.

MS Excel (MicroSoft Corp.). Найбільш поширений додаток з пакету офісних програм MS Office. Причини - наявність російськомовної версії та тісна інтеграцією з MS Word і PowerPoint. Проте, MS Excel - це електронна таблиця з досить потужними математичними можливостями, де деякі статистичні функції є просто додатковими вбудованими формулами. Розрахунки зроблені при її допомозі не визнаються авторитетними науковими журналами. Також у MS Excel неможливо побудувати якісні наукові графіки. Безумовно, MS Excel добре підходить для накопичення даних, проміжного перетворення, попередніх статистичних обчислень, для побудови деяких видів діаграм. Проте остаточний статистичний аналіз необхідно робити в програмах, які спеціально створені для цих цілей. Існують макроси-доповнення для MS Excel, що включають додаткові статистичні функції, які в основних випадках є достатніми для звичайного застосування. Пробну версію макросів можна узяти на сайті виробника.

Statistica (StatSoft, Inc.) — добре збалансоване за співвідношенням «потужність/зручність» ПЗ. Має широкий спектр функціональних алгоритмів і розвинену графіку, а також відповідні засоби для редагування графічних матеріалів. Містить більше 250 статистичних функцій. Користувач має знати статистичну термінологію, а об’ємна довідкова система дає змогу досить повно ознайомлюватися з алгоритмами, що використовуються. Широко розповсюджена.

(матеріал з http://www.economy.nayka.com.ua/?op=1&z=5676)

Використання надбудови ''Пакет аналізу'' для виконання аналізу складних даних

Якщо потрібно провести комплексний статистичний або інженерний аналіз, можна зберегти зусилля та час, скориставшись пакетом аналізу. Ви надаєте дані та параметри для кожного аналізу, а засіб використовує усі потрібні статистичні або інженерні макрофункції для проведення підрахунку та відображає результати в таблиці результатів. Деякі засоби, окрім таблиць результатів, створюють ще й діаграми.

Функції аналізу даних можна використовувати одночасно тільки на одному аркуші. Під час виконання аналізу даних на згрупованих аркушах результати відображаються на першому аркуші і пусті форматовані таблиці відобразяться на решті аркушів. Щоб виконати аналіз даних на решті аркушів слід перераховувати засіб аналізу на кожному аркуші.

Практична робота

1. Виконати завдання (сформульовані в презентації до уроку).

Розв'язки прикріпити до завдань уроку в Classroom