4.2. Определение формы представления данных для построения модели знаний
В работе [32] отмечено, что существуют десятки моделей представления знаний для различных предметных областей, которые могут быть сведены к следующим классам: продукционные модели, семантические сети, фреймы, формальные логические модели.
В случае когда предметную область возможно описать в виде набора аксиом, предпочтение следует отдать традиционным в представлении знаний формальным логическим моделям, основанным на классическом исчислении предикатов I-го порядка [146].
Определимся, что:
в данной работе следует понимать риск как вероятность возможного убытка или ущерба в результате действия как субъективных, так и объективных факторов (определение риска основано на статистических данных об успехе или неуспехе кредитов банка);
для оценки кредитного риска производится анализ кредитоспособности заемщика как желания, соединенного с возможностью своевременно погасить выданное обязательство;
сценарий неуспеха кредита является ассоциативным и формулируется на основе здравого смысла: сочетание выявленных СЗП, полученных в результате семантического эксперимента, и традиционно анкетируемых социально-демографических признаков, наиболее тесно связанных с ненадежностью КЗ;
перечисленные далее социально-демографические признаки соответствуют признакам, определяющим типологию КЗ: пол – «мужчина» и «женщина»; образование: высшее и средне-специальное; семейное положение: «есть дети», «нет детей»; возраст – до 25 лет, от 25 до 35 лет, от 35 до 45 лет, старше 45 лет;
для измерения признаков или характеристик кредита использованы шкалы: для оценки успеха события – логическая (истина или ложь); для оценки социально-демографических признаков – качественная; для психодиагностических признаков («вес» слов-признаков от 0 до 6 включительно) – качественная и числовая; для оценки риска: точечной – процентная, интервальной (интервалы допустимого риска) – числовая.
Следует отметить, что осуществление типологического анализа в целях описания моделей представления знаний, с учетом полученных данных методом многомерного шкалирования, полученные признаки имеют следующие отличительные особенности: «Кредит» – действие, отношение к которому проявляется через выявленные посредством ассоциативного эксперимента СЗП, определяющих СПП в связи с общепринятыми анкетируемыми признаками: демографическими (пол, возраст), социальными (семейное положение, образование), то есть однородность определяется принадлежностью к определенной типологии КЗ; полученные в результате семантического эксперимента СЗП имеют градации или вес от 0 до 6 включительно; каждая компонента имеет разные параметры, имеет разную размерность, имеет дискретное непараметрическое распределение, которое задается таблично; информационная модель должна быть прозрачная и открытая, чтобы осуществить возможность оптимизации по управлению риском уже на этапе классификации посредством выявления более актуальных характеристик кредитоспособности; для анализа и управления риском следует учитывать возможность отсутствия некоторых СЗП; признаки и градации признаков не должны иметь преимуществ, то есть признак «мужчина» не лучше и не хуже признака «женщина» равно, как и полученные ответы на вопросы.
На основе анализа работ, посвященных типологическому анализу в социологии, социальной психологии и психодиагностике [137, 138], оценке рисков [123, 126, 127], для построения МЗ и построения БЗ были адаптированы и модифицированы методы логико-вероятностного (ЛВ) моделирования, подробно изложенные (применительно к оценке рисков в кредитной сфере) в работах [13, 14, 19].
Подробное изучение проблем кредитного скоринга, начиная с выбора признаков «хорошего» и «плохого» КЗ, и анализ существующих методов решения задачи его классификации [18, 22] и оценки риска выдачи кредита c учетом субъективного кредитного поведения, дает право на следующие выводы, объясняющие основные причины использования логико-вероятностных методов для оценки риска кредитования физических лиц в данной работе: задание статистических данных позволяет вести вычисления с многомерными распределениями, в которых каждая компонента имеет свой закон распределения, не являющийся нормальным, что при оценке психологического аспекта отношения к действию «кредит» физических лиц является необходимым; оцениваемые параметры могут иметь разную размерность, могут быть заданы таблично, при этом осуществляется возможность вычислять вклады в риск объекта или всего множества объектов любых инициирующих событий-градаций и событий-признаков, позволяющих соответственно в дальнейшем управлять риском, что объясняет прозрачность данного метода и возможность оценки степени влияния субъективного поведения на принятие решения соискателя; сценарий риска является ассоциативным и рассматривается только как гипотеза, что является большим преимуществом при оценке психологических аспектов, и решает проблему дискриминационного характера кредитного скоринга; инициирующие признаки-события могут иметь не два состояния, а от 2 до 60 несовместных событий-градаций, что позволяет использовать достаточно большой список СЗП; возможность дополнения ЛВ-модели и совместного использования полученных статистических зависимостей делает данный метод универсальным.
Для осуществления типологического анализа на основе методов многомерного шкалирования перейдем к известному представлению данных в дихотомической шкале с учетом терминологии ЛВ-моделирования. В табл. 4.1 приведена классификация соответствия бинарных логических переменных – градаций Zjr объектам-признакам. СЗП, полученные в результате ассоциативного эксперимента, являются событиями-признаками, характеризующими СПП соискателя. Такие события-признаки для удобства рассмотрения сгруппированы в соответствии с терминологией психодиагностики личности [27, 107] и представлены в табл. 4.1, 4.2.
Таблица 4.1
Признаки i-го кредита
| Номер признака | Наименование признака | Обозначение событий-признаков | Число градаций | Обозначение градаций в событии признаке |
| 1 | 2 | 3 | 4 | 5 |
| Успешность кредита | Y | 2 | Вернул | |
| Не вернул | ||||
| 1 | Пол | Z07 | 2 | Z07 01 |
| Z07 02 | ||||
| 2 | Образование | Z08 | 2 | Z08 01 |
| Z08 02 | ||||
| 3 | Семейное положение | Z09 | 2 | Z09 01 |
| Z09 02 | ||||
| 4 | Возраст | Z10 | 4
| Z10 01 |
| Z10 02 | ||||
| Z10 03 | ||||
| Z10 04 | ||||
| Сгруппированные СЗП: | ||||
| 5 | означающие, что потребности превышают возможности (Z01) | Z01 01, Z01 02, Z01 03, Z01 04, Z01 05, Z01 06, Z01 07, Z01 08, Z01 09, Z01 10. | 7 | Z01 01 00,…. Z01 01 06
Z01 10 00,… Z01 10 06. |
Окончание табл. 4.1
| 1 | 2 | 3 | 4 | 5 |
| 6 | означающие преувеличение своих возможностей (Z02) | Z02 01, Z02 02, Z02 03, Z02 04, Z02 05, Z02 06. | 7 | Z02 01 00,…, Z02 01 06
Z02 06 06 . |
| 7 | означающих упрощение решения проблемы (Z03) | Z03 01, Z03 02, Z03 03, Z03 04, Z03 05, Z03 06,Z03 07, Z03 08, Z03 09. | 7 | Z03 01 00,…, Z03 01 06
Z03 09 06. |
| 8 | означающие нейтральный оттенок или отражающие рациональное поведение (Z04) | Z04 01, Z04 02, Z04 03, Z04 04, Z04 05, Z04 06, Z04 07, Z04 08, Z04 09, Z04 10, Z04 11, Z04 12, Z04 13, Z04 14. | 7 | Z04 01 00,…, Z04 01 06
Z04 14 00,…, Z04 14 06. |
| 9 | означающие, положительный оттенок (Z05) | Z05 01, Z05 02, Z05 03, Z05 04, Z05 05, Z05 06, Z05 07, Z05 8, Z05 09, Z05 10, Z05 11. | 7 | Z05 01 00,…, Z05 01 06
Z05 11 00,…, Z05 11 06. |
| 10 | означающие негативное отношение (Z06) | Z06 01, Z06 02, Z 06 03, Z06 04, Z06 05, Z06 06, Z06 07, Z06 08, Z06 09, Z06 10, Z06 11, Z 06 12, Z06 13 | 7 | Z06 01 00,…, Z06 01 06
Z06 13 00,…, Z06 13 06 |
Таблица 4.2
Градации в группах психологических признаков
| Наименование группы СЗП | Номер признака | Наименование признака: СЗП | Обозначение | Число градаций |
| 1 | 2 | 3 | 4 | 5 |
| означающие, что потребности превышают возможности | 1 | просто | Z01 01 | 7 |
| 2 | желания | Z01 02 | 7 | |
| 3 | имидж | Z01 03 | 7 | |
| 4 | неудовлетворенность | Z01 04 | 7 | |
| 5 | блага | Z01 05, | 7 | |
| 6 | новые вещи | Z01 06 | 7 | |
| 7 | необходимость | Z01 07 | 7 | |
| 8 | жизненная необходимость | Z01 08 | 7 | |
| 9 | магазины | Z01 09 | 7 | |
| 10 | качество приобретаемой вещи | Z01 10 | 7 |
Продолжение табл. 4.2
| Наименование группы СЗП | Номер признака | Наименование признака: СЗП | Обозначение | Число градаций |
| 1 | 2 | 3 | 4 | 5 |
| означающие преувеличение своих возможностей | 1 | нет проблем | Z02 01 | 7 |
| 2 | возможности | Z02 02 | 7 | |
| 3 | уверенность | Z02 03 | 7 | |
| 4 | совесть | Z02 04 | 7 | |
| 5 | риск | Z02 05 | 7 | |
| 6 | отдам | Z02 06 | 7 | |
| означающие упрощение решения проблемы | 1 | помощь | Z03 01 | 7 |
| 2 | выход | Z03 02 | 7 | |
| 3 | рассрочка | Z03 03 | 7 | |
| 4 | удобно | Z03 04 | 7 | |
| 5 | реклама | Z03 05 | 7 | |
| 6 | быстро | Z03 06 | 7 | |
| 7 | выгодно | Z03 07 | 7 | |
| 8 | просто | Z03 08 | 7 | |
| 9 | доступно | Z03 09 | 7 | |
| означающие нейтральный оттенок или отражающие рациональное поведение | 1 | работа | Z04 01 | 7 |
| 2 | расчёт | Z04 02 | 7 | |
| 3 | платежеспособность | Z04 03 | 7 | |
| 4 | доход | Z04 04 | 7 | |
| 5 | информированность | Z04 05 | 7 | |
| 6 | комиссия | Z04 06 | 7 | |
| 7 | выплаты | Z04 07 | 7 | |
| 8 | компетентность | Z04 08 | 7 | |
| 9 | платеж | Z04 09 | 7 | |
| 10 | семейный бюджет | Z04 10 | 7 | |
| 11 | дисциплина | Z04 11 | 7 | |
| 12 | здравомыслие | Z04 12 | 7 | |
| 13 | срок | Z04 13 | 7 | |
| 14 | скидки | Z04 14 | 7 | |
| означающие положительный оттенок | 1 | удовольствие | Z05 01 | 7 |
| 2 | радость | Z05 02 | 7 | |
| 3 | будущее | Z05 03 | 7 | |
| 4 | семья | Z05 04 | 7 | |
| 5 | дисциплина | Z05 05 | 7 | |
| 6 | благополучие | Z05 06 | 7 | |
| 7 | мечты | Z05 07 | 7 | |
| 8 | развитие | Z05 08 | 7 | |
| 9 | отдых | Z05 09 | 7 | |
| 10 | друг | Z05 10 | 7 | |
| 11 | надежда | Z05 11 | 7 |
Окончание табл. 4.2
| 1 | 2 | 3 | 4 | 5 | |
| означающие негативное отношение | 1 | долг | Z06 01 | 7 | |
| 2 | переплата | Z06 02 | 7 | ||
| 3 | ответственность | Z06 03 | 7 | ||
| 4 | забота | Z06 04 | 7 | ||
| 5 | обязательства | Z06 05 | 7 | ||
| 6 | расходы | Z06 06 | 7 | ||
| 7 | зависимость | Z06 07 | 7 | ||
| 8 | мошенничество | Z06 08 | 7 | ||
| 9 | манипулирование | Z06 09 | 7 | ||
| 10 | обуза | Z06 10 | 7 | ||
| 11 | расточительство | Z06 11 | 7 | ||
| 12 | головная боль | Z06 12 | 7 | ||
| 13 | обязанность | Z06 13 | 7 | ||
СЗП – события-признаки, характеризующие СПП соискателя, и соответствующие им логические переменные формируют первый уровень модели: Z01 01, Z01 02, Z01 03, Z01 04, Z01 05, Z01 06, Z01 07, Z01 08, Z01 09, Z01 10, Z02 01, Z02 02, Z02 03, Z02 04, Z02 05, Z02 06, Z03 01, Z03 02, Z03 03, Z03 04, Z0305, Z03 06, Z03 07, Z03 08, Z03 09, Z04 01, Z04 02, Z04 03, Z04 04, Z04 05, Z04 06, Z04 07, Z04 08, Z04 09, Z0410, Z04 11, Z04 12, Z04 13, Z04 14, Z05 01, Z05 02, Z05 03, Z05 04, Z05 05, Z05 06, Z05 07, Z05 08, Z05 09, Z0510, Z05 11, Z06 01, Z06 02, Z06 03, Z06 04, Z06 05, Z06 06, Z06 07, Z06 08, Z06 09, Z06 10, Z06 11, Z0612, Z06 13.
Такие события-признаки являются производными и содержат в свою очередь группы несовместных событий (ГНС в терминологии ЛВ-моделирования) – веса или определенный уровень выраженности СЗП. События-градации Z01 01 00,…,Z01 01 06,…Z06 06 00,…, Z06 13 00,…, Z06 13 06 являются инициирующими событиями для событий-признаков Z0101,…,Z0201,…,Z0301,…,Z0401,…Z0501,…Z0601,… Z0613, характеризующих СПП соискателя.
Будем рассматривать инициирующие события-градации, как веса слов-признаков – от 0 до 6 включительно, например, производному событию-признаку Z0101 соискатель указал инициирующее событие-градацию 6 – большую значимость СЗП «просто», это будет означать, что данное инициирующее событие-градация имеет наибольшую связь с действием «кредит» из семи возможных вариантов.
События-градации Z01 01 00,…,Z01 01 06,…Z06 06 00,…, Z06 13 00,…, Z06 13 06 логически связаны «ИЛИ», тогда как соответствующие события-признаки связаны логически «И». Социально-демографические признаки также являются событиями-признаками, характеризующими «кредит», и им соответствуют логические переменные Z07, Z08, Z09, Z10. Производные события-признаки Z07, Z08, Z09, Z10 содержат инициирующие события-градации: Z07 01, Z07 02, Z08 01, Z08 02, Z09 01, Z09 02, Z10 01, Z10 02,Z10 03, Z10 04, которые также логически связаны между собой «ИЛИ».
Производные события-признаки, соответствующие социально-демографическим признакам Z07, Z08, Z09, Z10, связаны логической связкой «И» с событиями-признаками Z01 01,…,Z02 01,…,Z0301,…, Z04 01,…Z05 01,…Z06 01,…Z06 13, характеризующими СПП соискателя.
Еще по теме 4.2. Определение формы представления данных для построения модели знаний:
- 4.3. Построение модели знаний
- Глава 4. Разработка метода построения модели знаний на основе оценки кредитоспособности
- Метод философского синтеза не пригоден для построения общенаучной модели Вселенной.
- Определение об отказе в передаче кассационных жалобы, представления для рассмотрения в судебном заседании Судебной коллегии Верховного Суда Российской Федерации
- Определение о передаче кассационных жалобы, представления вместе с делом для рассмотрения в судебном заседании Судебной коллегии Верховного Суда Российской Федерации
- МОДЕЛИ ПОСТРОЕНИЯ ГОСУДАРСТВЕННОГО АППАРАТА И ЕГО СООТНОШЕНИЕ С ОРГАНАМИ МЕСТНОГО САМОУПРАВЛЕНИЯ
- Оглавление I. Введение (МКБ и ГБ). 1 1. Определение контекста (МКБ). 1 2. Определение задачи (ГБ). 6 II. Мир мыслительного процесса (ГБ). 9 III. Металог: почему ты рассказываешь истории? (МКБ) 16 IV. Модель (ГБ). 18 V. Ни сверхъестественное, ни механическое (ГБ). 25 VI. Металог: зачем нужны безвредные лекарства для успокоения больного? (МКБ). 31 VII. Пусть левая рука твоя не знает... (ГБ). 33 VIII. Металог: секреты (МКБ). 38 IX. Защита веры (ГБ). 40 X. Металог: к чему ты подбираешься? (МКБ) 45 X
- Понятие, сущность н виды версий, их построение и проверка. Соотношение версии и модели расследования
- Формы и методы использования специальных знаний в криминалистике
- 6.2. ОСНОВНЫЕ ФОРМЫ ПЕРЕДАЧИ НАУЧНО-ТЕХНИЧЕСКИХ ЗНАНИЙ
- Виды и формы контроля знаний студентов
- § 3. Объект, предмет и задачи криминалистической науки и их роль в определении круга знаний, составляющих ее систему
- Тема: «Построение доверительного интервала для генеральной средней и доли»
- Модели определения премии опционов.
- НЕКОТОРЫЕ АСПЕКТЫ СУДЕБНОЙ ЗАЩИТЫ ПРАВ АВТОРОВ ПРОГРАММ ДЛЯ ЭВМ И БАЗ ДАННЫХ В РОССИИ