Целью данной статьи было уточнение и развитие методолого-теоретического аппарата получения и обработки данных в научных и практических исследованиях. Более узко – для методического обеспечения сбора данных для оценки цунамиопасности прибрежных зон. Более широко – для содействия информационным технологиям, постановке и решению задач геофизики и искусственного интеллекта.
В разных научных работах по теории измерений, анализу данных, исследованию операций, искусственному интеллекту, технической кибернетике выделяются и рассматриваются различные виды «шкал» [1; 2, с. 9-110; 3, с. 131-134; 4; 5, с. 104-115; 6; 7, с. 641-646; 8 и др.].
Наиболее распространённым и общепринятым формальным определением термина «шкала» является следующее, содержащееся в работах [1; 2, с. 9-110]: «Шкала (= «шкала измерений») – это однозначное отображение (гомоморфизм) «эмпирической системы с отношениями» <Ψ1> в «числовую систему с отношениями» <Ψ2>». При этом образы элементов Ψ1 и Ψ2 называются «шкальными значениями», и на основе свойства гомоморфизма отображения из свойств числовых отношений между шкальными значениями следуют выводы об «эмпирических отношениях» между объектами.
Из этого определения не ясно:
- Что есть «шкала» – процедура отображения или её результат?
- На основе каких параметров строится определение «шкалы» и какими параметрами шкала характеризуется?
- Всегда ли шкала является числовой системой?
- Что есть «эмпирическая система с отношениями»?
- На ЧТО распространяется определение шкалы: только на свойства объектов? На точки в пространстве свойств? А также на координаты и время? На отношения между объектами?
- Может ли всё это относиться не только к объектам, но и к точкам наблюдений, а также к виртуальному ментальному пространству особей?
Важно отметить, что эмпирическая система с отношениями (или без них) может не существовать до и без эмпирических исследований (например, слои геологических отложений, выделяемые геологом, до такого выделения могут не существовать).
Мною предлагается следующее альтернативное определение «шкалы», лишённое, как представляется, отмеченных неясностей. Это определение построено по принципу «матрёшки»: к первоначальному наиболее краткому определению поэтапно добавляются блоки и слои, усложняющие и детализирующие определение - вплоть до уровня понятия.
Наиболее краткое определение «шкалы»: ШКАЛА = это тип данных.
Что же понимается под «данными», какими они могут быть, как их можно преобразовывать и использовать? Как соотносятся «данные» и «информация»? Ответам на эти вопросы были посвящены, в частности, мои работы [4; 5, с. 104-115; 7, с. 641-645; 10, с. 137-145].
В моей статье о шкалах [11, с. 125-131] приводятся существующие и даются авторские определения основным терминам, связанным со «шкалами». Там, в частности, введены понятия «имманентных» и «назначенных» свойств. Дана совместная табличная характеристика шкал. Знания о шкалах распространены (помимо свойств) и на отношения. Элементами научной новизны в той статье обладает каждый из перечисленных пунктов.
В данной статье задаются некоторые принципиальные вопросы о шкалах, находятся на них ответы, методологическая и теоретическая необходимость которых вытекает из работ [2, с. 9-110; 3, с. 131-134; 4; 5, с. 104-115; 6; 7, с. 641-646].
Примем далее в тексте следующие обозначения.
Аv1, Аv2 – объекты; А – полное множество рассматриваемых объектов; ΔАk – k-е подмножество объектов; ΔАk ϵ А.
X – множество свойств, значения которых приписаны всему Аv, частям от Аv или точкам в Аv; xp – p-ое свойство; X = {x1, x2, …, xp, …, xP}; Р – число различных свойств; xpv – v-ое значение p-ого свойства; Z (xp) – область (односвязная или многосвязная) допустимых значений (= область определения) свойства xp.
Ω – множество различных отношений, каждое из которых задано на некотором ΔАk; ɷm – m-ое из этих отношений; m = 1, 2, …, M; M – число различных отношений.
S – множество шкал; Sq – q-я шкала; Sq (xp) – шкала, в которой определены значения свойства xp.
Определения и уточнения важных для данной статьи вспомогательных терминов, таких как «данные», «информация», «прямые и косвенные свойства», «объект», «выделение» объекта, «задание объекта по представлению», «классификации исходных заданий объекта», «знания», «онтологии» и ряда других, содержатся в работах [4; 5, с. 104-115; 6; 7, с. 641-646; 11, с. 125-131 и других].
Мною предлагается следующее альтернативное определение «шкалы» – более детализирующее – второго уровня.
Под «шкалой» (или «шкалой измерений») мы будем понимать тип данных, относящихся к множеству {Х} допустимых значений (данных) {xpv}, которые (значения) может принимать определяемое на некотором объекте свойство (или отношение на множестве объектов) Х, при условии, что фиксировано множество {Ф} допустимых преобразований ф над каждым из всех данных одновременно, т. е. над значениями {xpv}.
В разработанной нами и приводимой ниже характеристической таблице шкал (табл.) допустимые значения данных (т. е. допустимые элементы шкалы) указаны в столбце «ЭЛ», а допустимые преобразования – в столбце «ДП». Эти столбцы (а также столбцы ФН и ФМ) формируют определение каждой шкалы, а столбцы ИВ и МО характеризуют свойства шкал.
В разных научных работах по теории измерений, анализу данных, исследованию операций, искусственному интеллекту, технической кибернетике выделяются и рассматриваются различные виды шкал [1; 2, с. 9-110; 3, с. 131-134; 4; 5, с. 104-115; 6; 7, с. 641-646; 8 и др.]. Все эти шкалы делятся на сильные и слабые. Каждую из сильных шкал называют также арифметической (синонимы – количественной или метрической).
Среди сильных шкал выделяют абсолютную (А), интервалов (И) (синоним – предпочтений), отношений (О) и разностей (Р).
Среди слабых шкал выделяют шкалу наименований (Н) (синонимы – имён, номинальную, классификационную, логическую 2-го рода) и шкалу порядка (П) (синонимы – порядковую, ранговую, логическую 1-го рода). Мною введена также слабая шкала дискурсивная (Д)
Множество возможных значений данных сильной шкалы принадлежит континуальному (бесконечному и непрерывному либо дискретному – конечному или бесконечному – множеству) некоторой области определения Z (xp), а данных слабой шкалы – некоторому конечному множеству Z = {xpv} (v=1,…, V), – где V – общее число различных значений xpv – не упорядоченных для шкал Н и Д, но упорядоченных для шкалы П.
Введение мною шкалы Д обусловлено необходимостью выделять и использовать смысловые данные. Их можно интерпретировать [4] как подпространства (области – односвязные либо многосвязные) в «пространстве понятийных свойств». Такие грубые и чёткие подпространства задают определения, грубые и нечёткие – представления, а тонкие и чёткие – понятия. Такие данные могут получаться как в ходе эмпирических исследований, так и порождаться интеллектами (естественными или искусственными).
Далее мы охарактеризуем шкалы Н, П, И, Р, О, А, Д по следующим параметрам.
ЭЛ – элемент: что является элементом шкалы (её элементарным данным xpv): ЛЗ – любой знак (в том числе буква, слово, фраза, иероглиф, рисунок, цифра, число (целое или вещественное) – для слабых шкал; в этом случае множество допустимых (возможных) различных значений xpv в данной шкале конечно либо бесконечно, априори фиксировано или нет; ВЧ – вещественное число (в частности, натуральное) – для сильных шкал; в этом случае множество допустимых (возможных) различных значений xpv в данной шкале бесконечно либо конечно, априори фиксировано либо нет, и является либо нет континуумом в области определения Z (xp).
ДП – допустимое математическое преобразование ф=ф(xp) над каждым значением xp. Это ф трактуется [1; 2, с. 9-110; 8] как связь между данными «идеальной» и данной шкалы. Значения ДП: <1> ПО = ф(xp) – произвольное однозначное преобразование; <2> ПМ = ф(xp) – произвольное монотонное преобразование, сохраняющее порядок на значениях; линейные преобразования (ЛП): ЛПП = ф(xp) = аxp+в – ЛП полное, ЛПА = ф(xp) = xp+в – ЛП аддитивное, ЛПМ = ф(xp) = аxp – ЛП мультипликативное: <3> ТП = ф(xp) = xp – тождественное преобразование (т. е. никакие преобразования не допустимы).
ДП – допустимое математическое преобразование ф=ф(xp) над каждым значением xpg при условии, что одно и то же это ф производится сразу над всеми xp є Z (xp). Понятно, что говорить о математическом преобразовании ф=ф(xp) не имеет смысла, если в качестве ЭЛ выступает не ВЧ, а ЛЗ. Это ф трактуется [1; 2, с. 9-110; 8] как связь между данными «идеальной» и данной шкалы. Какими могут быть значения ДП: <1> ф(xp) есть произвольное однозначное (ПО) преобразование; ф(xp) – произвольное монотонное (ПМ) преобразование, сохраняющее порядок на значениях xpg; <2> линейное преобразование ф(xp) = аxp + в; <3> преобразование сдвига ф(xp) = xp+ в; <4> преобразование растяжения ф(xp) = а х xp ; <5> тождественное преобразование (т. е. никакие преобразования не допустимы) ф(xp) = xp.
ФН – фиксация нуля: зафиксирован ли жёстко нуль xp0 шкалы (в частности, является ли он «естественным», и если «да», то в = 0), «да» или «нет».
ФМ – фиксация масштаба: зафиксирован ли жёстко масштаб (единица измерения) шкалы? Если «да», то а=0.
ИВ – инвариантность выражений: какие из следующих арифметических выражений (равенств или неравенств) будут инвариантны относительно допустимого преобразования данных соответствующей шкалы? Выражения:
- xpv1= xpv2 или xpv1 ≠ xpv2;
- xpv1< xpv2 или xpv1> xpv2 ;
- (xp0– xpv1) / (xp0 – xpv2) = C;
- xpv1– xpv2 = C; (5) xpv1 / xpv2 = C; здесь С – некоторая константа.
МО – математические операции: какие математические операции (арифметические либо статистические) допустимы (имеют смысл) над значениями (данными) из эмпирической выборки рассматриваемой шкалы? Список МО:
- Определение перечня и частот встречаемости каждого из значений в выборке,
- Определение min, max и средних величин их частот встречаемости;
- Построение функции распределения статистических значений (частот), определение квантиля, медианы, моды;
- Определение статистических моментов распределения значений (обычных, центрированных и нормированных) и функций от них - стандарта, асимметрии, эксцесса;
- Сложение и вычитание;
- Умножение и деление.
На основе параметров ЭЛ, ДП, ФН, ФМ, ИВ и МО построена расположенная ниже характеристическая таблица для шкал разных типов. Напомним, что тип шкалы определяется параметрами ЭЛ, ДП, ФН, ФМ, а параметры ИВ и МО характеризуют свойства шкал.
Таблица
Характеристическая таблица шкал
№ | Шкала | ЭЛ | ДП ф(х) | ФН | ФМ | ИВ | МО |
1 | Н – наименований | ЛЗ | ПО | нет | нет | 1 | 1, 2 |
2 | П – порядка | ЛЗ | ПМ | да | нет | 1, 2 | 1, 2, 3 |
3 | И – интервалов | ВЧ | ах+в | нет | нет | 1, 2, 3 | 1, 2 |
4 | Р – разностей | ВЧ | х+в | нет | да | 1, 2, 4 | 1, 2, 5 |
5 | О – отношений | ВЧ | ах | да | нет | 1, 2, 5 | 1, 2, 6 |
6 | А – абсолютная | ВЧ | х | да | да | 1, 2, 3, 4, 5 | 1, 2, 3, 4, 5, 6 |
7 | Д – дискурсивная | ПК | нет | нет | нет | а, б, в, г | 1 |
В последующих статьях мы приведём примеры для свойств и отношений каждой из этих шкал (в частности – для свойств, используемых для объектов геологии, цунами и геокатастрофики в целом), а также рассмотрим особенности некоторых шкал нелинейных типов и некоторые теоретические утверждения о шкалах.