Я. А. Ваграменко Редакционный совет icon

Я. А. Ваграменко Редакционный совет


Смотрите также:
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...
Я. А. Ваграменко Редакционный совет...



Загрузка...
страницы: 1   ...   7   8   9   10   11   12   13   14   15
вернуться в начало
скачать
^

Согласование психолого-педагогических


измерений в многомерном пространстве

разнотипных признаков


Как известно из теории измерений, в практике научных и, в частности, психолого-педагогических исследований характеристики исследуемых объектов могут быть измерены в различных типах шкал: абсолютной, шкале отношений, шкале интервалов, шкале порядка и номинальной шкале (наименований) (см., например, [1,2]).

Шкалы первых трех типов содержат более богатую информацию, их показания можно подвергать определенным математическим преобразованиям и потому их часто называют сильными, количественными или арифметическими. Шкалы порядка и наименований уступают им по информативности и отражают качественные свойства - их обычно называют слабыми или качественными. Однако рекомендовать пользоваться только сильными шкалами нельзя. Приборы для измерения свойств объектов в сильных шкалах более дорогие, а в гуманитарных областях таких приборов зачастую нет. Кроме того, было установлено [3], что информативность шкалы порядка при экспериментах с большим числом объектов приближается к информативности абсолютной шкалы. Так что в ряде случаев с помощью более простых приборов или процедур можно получить почти такое же количество информации, как и с помощью сложных и дорогих.

Оценивать расстояние между объектами, все характеристики которых измеряются в одной из сильных шкал, несложно. Однако, в реальных задачах часто имеют дело с объектами, свойства которых измерены в разных шкалах, в том числе в порядковых и номинальных. В этом случае возникает непростая проблема оценки меры расстояния, близости, похожести как между объектами, так и между свойствами этих объектов. На практике часто используются психолого-педагогические тесты, на выходе которых получают различные характеристики тестируемых, измеренные, как правило, в порядковых или номинальных шкалах. Иногда появляется необходимость объединять эти характеристики в новые свойства и продолжать исследование над объектами.

Возникает задача получения аппарата (реализованного в виде программного средства), который бы позволял сравнивать между собой объекты (например, обучаемых) по совокупности свойств, измеренных в шкалах различного типа. Известно [3], что данная задача относится к направлению, именуемому анализом данных.

Исходная информация, которую нужно обрабатывать, чаще всего имеет вид числовых таблиц (матриц), состоящих из M строк и N столбцов. Строки A1, A2, …, Ai, …, AМ отражают информацию об изучаемых объектах (обучаемых), а столбцы X1, X2, … , Xj, …, XN отражают свойства (признаки, характеристики) этих объектов или явлений. Природа объектов может быть любой - это могут обучаемые, группы учащихся, отдельные социальные процессы и т.д. Понятно, что набор признаков, описывающих эти объекты, будет в каждом случае своим и должен отражать их наиболее важные свойства.

На пересечении i-й строки и j-го столбца указывается значение (Bij)-го признака у i-го объекта. Такой факт считается атомарной частью данных о конкретном i-м объекте. Полные данные об i-м объекте содержатся в совокупности всех элементов i-й строки. Информация же обо всех заданных свойствах изучаемых объектов, записанная в таблице "объект - свойство", называется таблицей данных. Таким образом, данные представляют собой совокупность отдельных конкретных фактов.

Одной из форм представления результатов анализа данных является матрица расстояний (близостей) между объектами. Эта матрица, задающая отношение "объект - объект", представляет собой симметричную квадратную матрицу размера М х М с неотрицательными элементами:



d 11 , . . . , d 1M

D = d 21 , . . . , d 2M

. . . . . . . . . .

d M1 , . . . , d MM


Элемент dij является значением некоторой меры близости (удаленности) между объектами Хi и Хj . Если для всех элементов матрицы удаленностей выполняется неравенство треугольника (диагональные элементы полагаются равными 0) dab < dbc + dca , то матрица D называется матрицей расстояний. В этом случае она отражает геометрическую конфигурацию точек (объектов) в N-мерном евклидовом пространстве признаков.

Рассмотрим, какие меры расстояния можно использовать при обработке разнотипных шкал. Необходимо, чтобы меры dij обладали следующими очевидными свойствами:

а) непрерывности: мера d(xi,xj) должна быть непрерывной функцией своих аргументов;

б) симметричности: предполагая пространство значений аргументов изотропным, потребуем, чтобы выполнялось соотношение d(xi,xj)= d(xj,xi);

в) нормированности: мера d(xi,xj) должна меняться в пределах от нуля до единицы, причем d(xi,xj)=0, если xi=xj ;

г) инвариантности: для преобразования f, допустимого в шкале данного типа, d(xi,xj)= d{f(xi),f(xj)};

д) свойствам треугольника: для любых трех объектов a, b, c справедливо, что dac < (dab + dbc ).


Необходимо выбрать меры dijп - для шкал порядка, dijн - для номинальных шкал, а также dijс - для шкал сильного типа (абсолютной, отношений и интервалов), затем - правило, по которому будет вычисляться итоговая мера dijр.


^ Мера расстояния для шкалы порядка.


При всех допустимых для этой шкалы преобразованиях f отношения из набора (<, >, =) между двумя числами xi и xj должны сохраняться и для чисел f(xi) и f(xj). Если мы построим матрицу М размером М x М (где М - число объектов в выборке А), в которой для каждой пары объектов укажем их отношение в шкале порядка, то эта матрица не изменится при всех преобразованиях f. Этим свойством матрицы и воспользуемся для конструирования меры dij [4]. Естественно считать, что одинаковы два объекта, имеющие одинаковые порядковые отношения со всеми другими объектами из выборки А. И наоборот, наиболее непохожие объекты будут иметь наибольшие отличия в своих отношениях с другими объектами. Различия в отношениях i-го и j-го объектов к некоторому k-му объекту будем считать по такому правилу:




xi > xk и xj > xk ;

dijk= 0, если xi < xk и xj < xk ;

xi = xk и xj = xk .


dijk = 1, если xi > xk и xj < xk ;

xi < xk и xj > xk .

dijk = 0,5, если xi = xk и xj  xk ;

xi  xk и xj = xk .


Суммарное различие между i-м и j-м объектами


dijп =( 1 / ( М - 1)) .

Легко видеть, что если xi = xj , то dij =0 , и что для объектов i и j , имеющих максимально разные порядковые позиции dij =1 . Очевидно выполнение и других требований к dij.

Существует канонический способ приписывания чисел упорядоченному множеству объектов [4], при котором можно получать то же значение dij , не строя матрицу отношений М. Данный способ был использован в созданном нами программном средстве при работе со шкалами порядка.

По данному способу, числа (назовем их нормированными рангами) строятся по такому правилу: первому по порядку объекту приписывается число 1, второму - 2 и так до конца. Если встречается L объектов с одинаковым порядковым номером (так называемые "серии") то всем этим объектам приписывается номер


x

' = ( 1 / L) . , где

p - количество объектов, предшествовавших серии. После такой канонизации dij находится по правилу


dij п = x'i - x'j / ( М - 1) .

Мера расстояний в номинальной шкале (наименований).


Допустимые преобразования для шкал этого типа всегда сохраняют отношения равенства, так что при всех возможных переименованиях в матрице М размера М х М будут сохраняться значения отношений между всеми парами объектов из выборки А в виде символов (=, ).

Расстояние dij между i-м и j-м объектами можно найти по матрице М , используя следующее правило [4]:


dijн = ( 1 / М ) . , где




dijk = 0, если xi = xk и xj = xk ;

xi  xk и xj  xk .




dijk = 1, если xi = xk и xj  xk ;

xi  xk и xj = xk .


Эта мера расстояния в шкале наименований удовлетворяет требованиям "а"-"д".

Между тем, мера d ij может быть найдена и без построения матрицы М , а прямо через числа Мi и Мj , указывающие частость встречаемости объектов, имеющих имена одинаковые с i-м и j-м объектами соответственно :

dijн = ( Mi + Mj ) / M ; dij = 0 , если i=j .

Данный способ вычисления меры использован в реализованном нами программном средстве при работе с номинальными шкалами.

^ Мера расстояния для сильных шкал.


Для сильных шкал (выше шкалы порядка) свойствам а)-д) удовлетворяет, например, мера [4]:


dijс = (xi – xj )/( xmax – xmin ).


Условимся лишь, что для частного случая, когда xmax = xmin, неопределенное отношение 0/0 принимается равным 0.


^ Вычисление результирующего расстояния

в пространстве разнотипных признаков.


Теперь мерами dc, dп, dн можно пользоваться в многомерном случае, определяя расстояние dp в пространстве разнотипных признаков по типу евклидова расстояния (для трех разнотипных признаков) [3] :

dp =


После процедуры нормирования, например, по правилу:

dpij = dpij /dpmax,

меры такого типа также удовлетворяют требованиям "а"-"д".


Однако, можно учесть и тот факт, что в конкретной решаемой задаче каждый признак обладает своим весовым коэффициентом , и эти весовые коэффициенты должны либо увеличивать, либо уменьшать влияние отдельных признаков на общий результат. Тогда расстояние dp можно вычислять, например, следующим образом:


dp =


Положительные весовые коэффициенты с, п, н следовало бы задавать [4], как функцию от априорно известной информативности признака, однако последняя зависит от решаемой задачи и становится известной уже после того, как задача решена. В условиях такой неопределенности обычно полагают все  = 1. Но в случае разнотипных признаков можно, по-видимому, задавать  пропорционально потенциальной информативности шкалы. Ведь известно, что один и тот же признак несет больше информации, если его измерять, например, в шкале отношений, чем в шкале порядка, и тем более в шкале наименований. Так что при отсутствии априорных данных об актуальной информативности каждого признака можно было бы считать, что с > п > н.


На основе вышеизложенного разработан программный модуль. Для реализации был выбран язык программирования Турбо-Паскаль-7.0. [5,6]. С помощью данного программного модуля, в рамках конкретной задачи, исследователь вводит структуру данных по объектам (например, обучаемым), составленную из признаков различного типа (сильный, порядковый и номинальный) с различными коэффициентами информативности. Затем в соответствии со сформированной структурой данных вводится матрица данных с именами объектов и их характеристиками. Все исходные данные сохраняются в отдельных файлах. При необходимости на любом этапе можно откорректировать как элементы структуры, так и элементы матрицы данных. После чего исследователь выбирает и задает пространство (совокупность) признаков для построения матрицы расстояний (близостей) между объектами в данном пространстве.

Программный модуль вычисляет и сохраняет для дальнейших исследований, как все матрицы расстояний между объектами по отдельным выбранным признакам, так и итоговую матрицу расстояний в многомерном пространстве. Результаты сохраняются в отдельных файлах. Для исследования влияния признаков на распределение объектов в пространстве можно изменять само пространство признаков, включая или исключая из исследования отдельные признаки, а также величины коэффициентов информативности различных признаков, чтобы ослабить или усилить вклад того или иного признака в общий результат распределения объектов. После указания конкретного объекта исследователь может получить полную картину распределения вокруг него других объектов, начиная с самых близких, с выводом величин расстояний.

Итоговая матрица расстояний (близостей) между объектами может использоваться для дальнейших исследований в качестве промежуточного результата при применении алгоритмов кластер-анализа или метрического шкалирования [3].

Определенное эмпирическим путем то или иное пространство (модель) признаков с конкретными коэффициентами информативности могут подвести исследователя к созданию нового комплексного психолого-педагогического признака, не поддающегося простым измерениям и определениям (латентного признака).

Литература


  1. Михеев В.И. Моделирование и методы теории измерений в педагогике. - М.: Высшая школа, 1987.

  2. Матушанский Г.У. Проблемы измерения в педагогической диагностике. /Труды Международного семинара "Исскуственный интеллект в образовании" Казань, 1-4 октября 1996г. № 2.

  3. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. -Новосибирск: Издательство института математики, 1999.

  4. Загоруйко Н.Г., Ёлкина В.Н., Лбов Г.С. Алгоритмы обнаружения эмпирических закономерностей. - Новосибирск: Наука, 1985.

  5. Зуев Е.Л. Система программирования Турбо Паскаль. - М.: Радио и связь, 1992.

  6. Фаронов В.В. Турбо Паскаль 7.0 - М.: Нолидж, 2001.



Т.Б. Казиахмедов




оставить комментарий
страница14/15
Дата11.09.2011
Размер1,42 Mb.
ТипНаучно-методический журнал, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы: 1   ...   7   8   9   10   11   12   13   14   15
плохо
  1
отлично
  1
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Загрузка...
Документы

наверх