Прогнозирование кредитоспособности с использованием нечеткой искусственной иммунной системы сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Прогнозирование кредитоспособности с использованием нечеткой искусственной иммунной системы

1. Аннотация:

Искусственная иммунная система основана на естественной иммунной системе и имитирует механизм обучения и защиты организма. В последние годы его применение возросло во многих секторах, включая интеллектуальный анализ данных. В этой статье мы описываем нечеткий алгоритм AIS, применяемый для кредитного скоринга в банковском секторе. Он использует набор нечетких правил if..then, что делает алгоритм понятным для человека. Предполагается, что модель классификатора будет показывать более высокую точность и быть конкурентоспособной с другими классификаторами.

2. Введение

«Купи сейчас, заплати позже» – это очень популярное и заманчивое предложение, сделанное финансовыми и розничными фирмами, которое помогает им увеличить свою клиентскую базу. Однако необходимость доступа к риску, связанному с дефолтом, при котором клиент не может погасить кредит, должна быть понята как сторонами – кредитором, так и клиентом. Важно понимать кредитное обязательство и погашать задолженность к концу срока кредита. Таким образом, вопрос о том, кому предложить кредит и какую сумму составили наиболее заметные кредиторы риска, необходимые для оценки.

Способность кредитного рейтинга улучшать время и процесс принятия решений всегда была ключевым моментом и привлекала исследователей для оказания помощи как кредиторам, так и общественности. Этот риск был уменьшен с развитием технологий и использованием различных статистических методов и алгоритмов. Чем выше кредитный рейтинг, тем выгоднее для кредитора понять ценность клиента. Скоринг основан на прогнозном моделировании, которое оценивает вероятность невыполнения клиентом финансовых обязательств. Он анализирует данные клиента с другими данными, помогая нам предсказать вероятность, если клиент собирается по умолчанию или нет.

В прошлом традиционные статистические методы использовались для создания кредитного скоринга для банков и финансовых учреждений. С развитием технологий и концепций интеллектуального анализа данных в последние десятилетия, новые и различные передовые алгоритмы анализа данных были применены к проблеме кредитного скоринга, которая является более надежной и эффективной, чем традиционные методы. Было множество методов, включая параметрические статистические методы, такие как логистическая регрессия, непараметрические методы, такие как деревья решений и k-ближайшие соседи, и вычислительные подходы, такие как искусственные нейронные сети (ANN). Передовые гибридные методы, такие как генетическое программирование и нечеткие алгоритмы, также применялись для прогнозирования кредитного скоринга для клиента.

Логистическая регрессия была одним из самых популярных инструментов для задач классификации. Наряду с пригодностью для различных видов распределения, для повышения его точности и уменьшения частоты ошибок, несколько методов были объединены с общей логистической моделью. ИНС были следующими наиболее популярными инструментами, которые по своей точности превосходили другие традиционные методы, особенно связанные с нелинейными методами. Они были разработаны для копирования нейрофизиологии человеческого разума в нелинейную регрессионную модель.

Fuzzy Logic предоставляет математический инструмент для интерпретации и манипулирования информацией так, как она напоминает процессы человеческого общения и рассуждения. Для анализа данных используется нечеткая логика, а не обычная логическая логика. Генетическое программирование извлекает интеллектуальные отношения в системе и может рассматриваться как древовидная структура с правилами if..then.

Недавнее и продолжающееся исследование искусственной иммунной системы (АИС), основанной на естественных иммунных системах. Это адаптивная система, вдохновленная человеческой иммунологией и наблюдаемыми функциями и принципами и, следовательно, применяемая для решения проблем и прогнозного анализа. Мы предлагаем модель с использованием AIS в сочетании с нечеткой логикой для прогнозирования кредитного скоринга для банков и финансовых учреждений.

3. Обзор литературы

В прошлом были разработаны различные методы кредитного скоринга. Однако с помощью современных алгоритмов и методов интеллектуального анализа данных используемая модель постоянно обновлялась для получения более точных и точных результатов. Исторически один из общепринятых статистических методов логистической регрессии использовался в основном для задач классификации [1]. Наряду с пригодностью для различных видов распределения, для повышения точности и уменьшения частоты ошибок несколько методов были объединены с общей логистической моделью. Обобщенная модель логистической регрессии является общим видом бинарной логистической модели и модели полиномиальной логистической регрессии [1]. Уравнение для модели полиномиальной логистической регрессии имеет вид

Где x – это объяснительные уравнения, а Y – переменная отклика, а (p + 1) – вектор коэффициентов регрессии для j-й переменной.

Однако, когда речь шла о нелинейных данных, их точность была снижена, и ANN было предложено их преодолеть.

Модель искусственной нейронной сети представляла собой три слоя – входной, скрытый и выходной. Входной слой обрабатывает входные объекты в скрытом слое, который, в свою очередь, рассчитывает адекватные веса, используя передаточную функцию и, следовательно, отправляя ее на выходной слой. Объединение многих нейронов в взаимосвязанную систему помогает обнаруживать нелинейные отношения в данных. Он отражает более высокую точность по сравнению с традиционными статистическими методами и логистической регрессией. Трехслойный персептрон может быть изображен так, как показано на рисунке 1 [1].

Рисунок: 1

Однако их критиковали за плохую работу с небольшими данными или несоответствующими атрибутами. Несмотря на то, что было предложено много методов для борьбы с ней, она усложнила модель и вызвала ограничения из-за длительного процесса обучения.

Нечеткая система представляет и манипулирует данными, которые напоминают человеческое мышление и общение. Нечеткие переменные характеризуются тегом name, набором нечетких значений и функцией членства, которая присваивает значение членства, метку реальному значению в предварительно определенном диапазоне. Его структура включает в себя четыре основных компонента – фаззайзер, который переводит четкие значения в нечеткие значения; интерференционный двигатель, который применяет механизм нечеткого рассуждения для получения нечеткого вывода; дефаззификатор, который переводится в четкую ценность и базу знаний, которая содержит базу правил и исходную базу данных [2]. Это изображено как на рисунке 2.

Рисунок 2

Искусственная иммунная система (АИС) – один из новейших методов, применяемых для кредитного скоринга. Он основан на моделях естественной иммунной системы. Для решения проблем он следует теоретическим и наблюдаемым иммунным функциям, принципам и моделям. Он принимает некоторые ключевые концепции, такие как отбор клонов, мутация и мера сродства. AIS наряду с нечеткой логикой имеют большие преимущества в отношении управления неопределенностью и неопределенностью и предоставляют правила, легко интерпретируемые пользователями [3].

4. Решение

Мы предлагаем алгоритм, основанный на принципе клонального отбора, который используется для объяснения основных свойств адаптивной иммунной системы антигенам. Основная идея заключается в том, что те В-клетки, которые идентифицируют антигены, отбираются для роста. В этой модели не проводится никакого различия между B-клетками и рецептором, поэтому каждая клетка называется B-клеткой.

Алгоритм использует большую популяцию B-клеток. Каждая В-клетка доживает до определенного возраста и представляет правило, которое закодировано в виде строки, как обсуждалось ранее.

Классификатор использует 4-х шаговый процесс: инициализация, генерация правил, изучение правил и завершение. Из набора данных начальный набор B-клеток создается из антигенов. Фаза генерации правил неоднократно использует алгоритм AIS для генерации правил до максимального изменения с использованием выбора клона, который выбирает B-клетки на основе их способности размножаться или их пригодности, а затем гипермутирует их и, наконец, заменяет, когда каждая B-клетка созревает, и их возраст достигает 0 , умереть. Возраст B-клетки рассчитывается по формуле:

newAge = oldAge + defaultAge * fitness if newFitness> oldFitness

Фазы изучения правил: выберите лучшую B-клетку из совокупности алгоритма AIS и добавьте ее в набор правил, если он увеличивает скорость классификации. Наконец, мы проверяем условия расторжения. Мы можем использовать любое условие остановки для завершения цикла. Если условие выполнено, изучение текущего класса завершено, алгоритм переходит к следующему классу. Если они не выполняются, процесс повторяется со следующим запуском АИС. Мы также можем установить количество выученных правил для каждого класса.

5. Методология

При использовании системы нечеткого классификатора правила нечеткого if..then используются для задачи классификации n-мерных шаблонов. Например,

Правило Rj: если x1 – это A1, x2 – это A2, а in – это Ajn, то класс Cj с CF = CFj.

Где Rj – метка j-го нечеткого правила if..then; A1, A2… Ajn – предшествующее нечеткое множество в интервале [0,1]; Cj – результирующий класс, а CFj – фактор достоверности нечеткого правила Rj.

Введение некоторых условий «не заботьтесь» помогает сократить прежние правила и делает их более понятными для человека, чем другие правила. Набор лингвистических значений используется в нечетких множествах, имеющих членство, однородно разделенных на треугольные нечеткие множества. Для задачи классификации шаблонов мы можем использовать любые специализированные функции принадлежности в нечетком классификаторе.

Рассчитать степень достоверности нечеткого правила за несколько шагов.

Шаг 1. Рассчитайте совместимость каждого шаблона обучения с правилом.

Шаг 2. Рассчитайте оценки относительной совместимости моделей обучения.

Шаг 3. Найдите класс, в котором относительная совместимость максимальна. Если два или более классов имеют максимальное значение и шаблон обучения, совместимый с правилом нечеткости, не существует, то результирующий класс не может быть определен.

Шаг 4. Рассчитайте степень достоверности CFj.

Правило победителя будет иметь максимальный продукт совместимости и степени уверенности. Мы можем использовать некоторые из следующих лингвистических значений, поскольку каждое нечеткое правило кодируется как строка,

0: все равно (DC), 1: маленький (S), 2: средний-маленький (MS), 3: средний (M), 4: средний-большой (ML) и 5: большой (L) ).

В хранилище машинного обучения UCI имеется два набора данных по австралийским и немецким кредитам [4]. Австралийский набор кредитных данных содержит 690 экземпляров и 2 класса. Класс 1 имеет 307 экземпляров, а класс 0 – 383 экземпляра. Немецкий набор данных содержит 1000 экземпляров и 2 класса. Класс 1 имеет 700 экземпляров, а класс 0 имеет 300 экземпляров.

Оба набора данных должны быть нормализованы для любого пропущенного значения или для выбора функции, чтобы найти, какой атрибут способствует более высокой точности модели. При необходимости данные будут изменены на бессмысленные для конфиденциальности. Точность будет сравниваться с другими классификаторами, такими как логистическая регрессия, нейронная сеть обратного распространения, грубые множества и машина опорных векторов на основе правильно классифицированной, неправильно классифицированной и кривой ROC.

7. Хронология

Создание проекта займет около двух с половиной месяцев. Первым этапом будет изучение и понимание источника данных, типов данных, отсутствующих значений или выбросов. Вторым этапом будет предварительная обработка данных и любые предварительные алгоритмы, которые мы применяем, и проверяем их соответствующую точность. Мы применяем выбор характеристик, дискретизацию или агрегирование данных, применяем классификатор AIS и сравниваем его с другими классификаторами. Для лучшего понимания мы также размещаем логику проблемы на сайте критического мышления, которая помогает нам решать различные проблемы, с которыми мы могли бы столкнуться при построении нашей модели.

8. Biosketch

Причина, по которой я выбрал этот проект в качестве моего окончательного проекта Capstone, заключается в том, чтобы продемонстрировать мое понимание и интерес к области анализа данных. Я использую расширенный интеллектуальный анализ данных, который добавил бы мои предыдущие знания в области анализа данных. Я также узнаю о новых исследованиях и продвижении в этой области, которые расширили бы мои знания и понимание концепций.

Зарегистрируйся, чтобы продолжить изучение работы

    Поделиться сочинением
    Ещё сочинения
    Нет времени делать работу? Закажите!

    Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.