Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Прогнозування пасажирів, які вижили під час катастрофи «Титаніка», за допомогою дерева прийняття рішень.

View through CrossRef
У статті запропоновано застосування методу дерева прийняття рішень для прогнозування пасажирів, які вижили в результаті катастрофи лайнера «Титанік». У якості вхідних даних використано набори даних «Titanic – Machine Learning from Disaster», що наявні у відкритому доступі на платформі Kaggle. Дерева прийняття рішень добре підходять для вирішення задач класифікації, а їхня простота інтерпретації робить цей метод кращим вибором серед інших алгоритмів машинного навчання. У навчальному наборі даних було виконано модифікацію, щоб заповнити відсутні значення. Оцінку розподілу якісних і кількісних ознак даних та пошуку в них закономірностей здійснено за допомогою візуального аналізу даних, що дало змогу виділити ознаки пасажирів, які корелюють з їхнім виживанням найбільше, і відповідно покращити набір даних. Дерево прийняття рішень для кінцевого набору даних побудовано за допомогою бібліотеки scikit-learn (sklearn), яка надає потужні інструменти для машинного навчання в Python. Точність побудованого дерева рішень становить 77% на відкладеній вибірці. Подальше дослідження застосування дерева прийняття рішень для даного набору даних може бути проведено шляхом використання методу налаштування гіперпараметрів дерева (hyperparameter tuning), який допоможе покращити точність побудованого дерева рішень.
Title: Прогнозування пасажирів, які вижили під час катастрофи «Титаніка», за допомогою дерева прийняття рішень.
Description:
У статті запропоновано застосування методу дерева прийняття рішень для прогнозування пасажирів, які вижили в результаті катастрофи лайнера «Титанік».
У якості вхідних даних використано набори даних «Titanic – Machine Learning from Disaster», що наявні у відкритому доступі на платформі Kaggle.
Дерева прийняття рішень добре підходять для вирішення задач класифікації, а їхня простота інтерпретації робить цей метод кращим вибором серед інших алгоритмів машинного навчання.
У навчальному наборі даних було виконано модифікацію, щоб заповнити відсутні значення.
Оцінку розподілу якісних і кількісних ознак даних та пошуку в них закономірностей здійснено за допомогою візуального аналізу даних, що дало змогу виділити ознаки пасажирів, які корелюють з їхнім виживанням найбільше, і відповідно покращити набір даних.
Дерево прийняття рішень для кінцевого набору даних побудовано за допомогою бібліотеки scikit-learn (sklearn), яка надає потужні інструменти для машинного навчання в Python.
Точність побудованого дерева рішень становить 77% на відкладеній вибірці.
Подальше дослідження застосування дерева прийняття рішень для даного набору даних може бути проведено шляхом використання методу налаштування гіперпараметрів дерева (hyperparameter tuning), який допоможе покращити точність побудованого дерева рішень.

Related Results

ПІДХОДИ ТА МЕТОДИ РОЗРОБКИ, ПРИЙНЯТТЯ ТА РЕАЛІЗАЦІЇ УПРАВЛІНСЬКИХ РІШЕНЬ
ПІДХОДИ ТА МЕТОДИ РОЗРОБКИ, ПРИЙНЯТТЯ ТА РЕАЛІЗАЦІЇ УПРАВЛІНСЬКИХ РІШЕНЬ
Будь-яка цілеспрямована діяльність людини завжди пов’язана з прийняттям рішень, а процес цей є структурним елементом, найважливішим атрибутом діяльності. У всіх сферах суспільства,...
ОЦІНКА ЯКОСТІ ПОСЛУГ В УПРАВЛІННІ МІСЬКИМ ПАСАЖИРСЬКИМ ТРАНСПОРТОМ
ОЦІНКА ЯКОСТІ ПОСЛУГ В УПРАВЛІННІ МІСЬКИМ ПАСАЖИРСЬКИМ ТРАНСПОРТОМ
Вступ У сучасних умовах роль міського пасажирського автомобільного транспорту у загальній транспортній системі м. Одеса неухильно зростає. Автомобільний транспорт забезпечує економ...
ВИКОРИСТАННЯ МОДЕЛЕЙ ОДНОГО ЧАСОВОГО РЯДУ ДЛЯ ПРОГНОЗУВАННЯ ЕКОНОМІЧНИХ ПОКАЗНИКІВ У СУЧАСНИХ УМОВАХ
ВИКОРИСТАННЯ МОДЕЛЕЙ ОДНОГО ЧАСОВОГО РЯДУ ДЛЯ ПРОГНОЗУВАННЯ ЕКОНОМІЧНИХ ПОКАЗНИКІВ У СУЧАСНИХ УМОВАХ
Досліджено основні статистичні методи прогнозування, які базуються на даних одного часового ряду. Розглянуто особливості використання для прогнозування трендових моделей. Відмічено...
Аналіз проблеми застосування методів машинного навчання для оцінювання та прогнозування дефектів програмного забезпечення
Аналіз проблеми застосування методів машинного навчання для оцінювання та прогнозування дефектів програмного забезпечення
Здійснено оцінювання та виконано аналіз літературних джерел, в яких досліджено методи машинного навчання для прогнозування дефектів програмного забезпечення. Визначено основні хара...
Кібертехнології та математичне моделювання для пришвидшення петлі Джона Бойда в асиметричній війні
Кібертехнології та математичне моделювання для пришвидшення петлі Джона Бойда в асиметричній війні
Актуальність статті обумовлена тим, що російсько-українська війна за всіма ознаками є асиметричною і досягти перемоги у ній виключно стандартним силовим протистоянням на полі бою н...
Оцінка економічної ефективності інновацій в органічному землеробстві
Оцінка економічної ефективності інновацій в органічному землеробстві
Мета. Мета статті – здійснити оцінку економічної ефективності інновацій в органічному землеробстві шляхом визначення доцільності застосування біопрепаратів під час вирощування різн...
Доцільність застосування систем прогнозування як складової частини процесу управління ІТ-проєктами
Доцільність застосування систем прогнозування як складової частини процесу управління ІТ-проєктами
Зосереджено увагу на обґрунтуванні доцільності використання статистичних методів, зокрема прогнозування, для покращення процесу управління проєктами. Описано специфіку задач у проц...
Комп’ютерна стабілометрія в оцінці функціонального стану людини
Комп’ютерна стабілометрія в оцінці функціонального стану людини
Актуальність. Комп’ютерна стабілометрія дає змогу досліджувати функціональну систему  підтримки рівноваги. Цей метод має широкий спектр застосування: оцінювання відновлення функцій...

Back to Top