КЛАССИФИКАЦИЯ УЧЕБНЫХ ФАКТОВ МЕТОДОМ КЛАСТЕРНОГО АНАЛИЗА 1. Проблема классификации фактов. Формирование у учащихся эмпирических знаний -- многогранный процесс, результат которого определяется множеством факторов. Рассматриваемые в курсе физики факты и эксперименты, с помощью которых они были установлены, с точки зрения изучения их учащимися, не равнозначны.
Например, факты существования отражения света, магнитного поля, силы трения достаточно легко изучаются школьниками даже без демонстрационного эксперимента, так как с этими явлениями они встречается в повседневной жизни. Факты существования интерференции световых волн, резонанса, наличия двух родов электричества могут быть установлены и изучены с помощью учебного эксперимента. Факт существования ядерных реакций или нейтрона не может быть установлен средствами учебного эксперимента и рассматривается исключительно на умозрительном уровне.
Поэтому прежде чем начать исследование процесса формирования эмпирических знаний, необходимо упорядочить факты, выявить их классы. Подобная классификация является одним из первых этапов исследования элементов учебного материала, ее реализация позволяет лучше понять общие принципы и тенденции их усвоения.
В настоящее время широкое распространение в гуманитарных исследованиях получил метод автоматической классификации, называемый также кластерным анализом [1-5, 7, 8, 14, 15]. Его преимущество над умозрительной классификацией состоит в объективности результатов и возможности учета нескольких характеристик классифицируемых объектов. Метод кластеризации наиболее эффективен, когда неизвестны исходное естественное распределение объектов, количество и состав классов.
2. Экспертная оценка дидактических характеристик учебного факта. Метод кластерного анализа многомерных объектов требует установления основных признаков, характеризующих данные объекты, и их измерение или оценку. Основными факторами, определяющими характер усвоения физического факта, как показано в [9], является среда, то есть совокупность физических явлений, окружающих человека, и учитель, излагающий изучаемый материал на умозрительном уровне или с опорой на систему учебных опытов и наблюдений. Поэтому в качестве дидактических характеристик учебного факта нами выбраны следующие: -- возможность экспериментального установления факта учащимися школы в повседневной жизни (учет влияния среды); -- возможность экспериментального установления факта на уроке физики (учет влияния учебного эксперимента, проводимого на уроке); -- сложность умозрительного изучения факта (учет эффективности умозрительного изучения). Для классификации фактов, изучаемых в школе, была произведена их случайная выборка из стандартных учебников [6, 10-13], в результате чего получена совокупность из 90 фактов. Оценка их дидактических характеристик осуществлялась методом экспертных оценок [16].
В состав экспертной комиссии вошли специалисты с высшим педагогическим образованием, преподаватели педагогического института и учителя физики. Так как все эксперты достаточно хорошо владеют школьным курсом физики и методикой его преподавания, то будем считать, что коэффициент компетентности у них одинаково высок и равен 1.
Используемые нами результаты получены в процессе проведения педагогической экспертизы по двум различным методикам. Экспертиза 1 состояла в следующем: эксперту предоставлялись карточки с названиями физических фактов, листы с оценками разложенные в ряд в порядке возрастания, и критерии оценки характеристик и . Задача эксперта состояла в том, чтобы, пользуясь предложенными критериями, оценить количество исследуемого качества у каждого факта и разложить карточки с фактами по листам с соответствующими оценками. В экспертизе участвовало 5 преподавателей кафедры физики Глазовского государственного педагогического института.
Методика проведения экспертизы 2 предусматривала заполнение экспертом специального бланка, в котором он ставил оценки в соответствии с предложенными ему критериями. При этом использовались три оценки: 1 -- если данное качество в исследуемом объекте присутствует, 0 -- если оно отсутствует и 0,5 -- если оцениваемое качество присутствует частично. При этом учитывались ответы 15 экспертов, каждый из которых имеет высшее образование и к моменту проведения опроса работал преподавателем или учителем физики.
Полученные таким образом результаты были обработаны методом среднего
так, что каждый из оцениваемых фактов имел свои значения и в первом
случае и и во втором. Для установления степени согласованности
оценок экспертов были найдены коэффициенты корреляции
по формуле [3]:
После первичного тестирования проводилось повторное собеседование с экспертами об отдельных ответах с целью повышения надежности метода. Расчет коэффициентов корреляции по результатам экспертизы 1 по карточкам дает значения, лежащие в интервале 0,7-1, что свидетельствует о хорошей согласованности экспертов.
3. Сущность кластерного анализа. Задача кластерного анализа состоит в классификации многомерных объектов, свойства которых характеризуются несколькими параметрами. Сущность метода кластерного анализа состоит в последовательном объединении (разъединении) групп объектов начиная с самых близких (далеких) [1, 2, 4, 7, 14, 15]. Нами используется агломеративная процедура, состоящая в образовании множества мелких кластеров из наиболее сходных объектов и их последовательном объединении. В качестве меры близости двух объектов, как правило, используется геометрическое расстояние между точками, соответствующими этим объектам, в пространстве, образованном характеристиками, по которым осуществляется классификация.
Используемый алгоритм иерархической кластеризации состоит в последовательном повторении цикла из трех операций: 1) нахождение пары наиболее близких объектов и 2) объединение объектов и в один кластер и присвоение ему нового имени 3) вычисление расстояний от нового кластера до каждого другого объекта или кластера и возвращение к первой операции. При вычислении координат каждого нового кластера учитывают весовые коэффициенты вошедших в него кластеров.
Рассмотрим множество из объектов, каждый из которых характеризуется совокупностью признаков В пространстве каждому объекту соответствует точка. В качестве меры близости двух объектов и обычно выбирают евклидово расстояние между этими точками:
На начальном этапе считают, что каждый объект образует кластер с весовым коэффициентом 1. Для каждой пары объектов определяют меру близости и, сравнивая их друг с другом, находят наиболее близко расположенные объекты, которые объединяются в один кластер с весовым коэффициентом 2, показывающим количество объектов в группе. Координаты нового кластера определяются как средние взвешенные координат объединенных кластеров. Затем процесс повторяется. При слиянии двух кластеров и c весовыми коэффициентами и получающийся кластер имеет координаты и весовой коэффициент соответственно:
В результате шагов, в каждом из которых два кластера объединяются в один, получается разбиение на кластеров.
Нами была написана программа на языке Pascal, обеспечивающая кластеризацию двух- и трехмерных объектов по изложенному выше алгоритму. Использование этой программы позволяет осуществить естественную классификацию физических фактов и определить координаты центров получившихся кластеров. Кроме того, программа рисует облако точек, соответствующее классифицируемым объектам, на координатной плоскости и в трехмерном пространстве, позволяя вращать картинку для выбора удобного ракурса просмотра.
4. Результаты кластеризации физических фактов. Использование разработанной программы позволяет осуществить естественную классификацию физических фактов и определить координаты центров получившихся кластеров. На рис.1, а также на рис.2, 3 и 4 показаны распределения кластеризуемых объектов на координатных плоскостях, получившиеся в результате проведения предварительной и окончательной экспертизы. Каждому объекту с характеристиками поставлена в соответствие точка с теми же координатами в пространстве соответствующих признаков. На этих же рисунках нанесены центры кластеров, с которыми соединены точки, соответствующие входящим в них объектам.
Анализируя представленные распределения фактов, можно выделить следующие закономерности: 1) чем больше возможность установления факта в повседневной жизни, тем больше возможность его установления на уроке; 2) чем больше возможности и установления факта в повседневной жизни и в условиях обучения, тем меньше сложность его умозрительного изучения. В самом деле, коэффициент корреляции между и равен 0,65 (по результатам предварительной экспертизы 0,86), между и и он соотвественно составляет и .
Как видно из рис.1, в двухмерном пространстве признаков и учебные факты разделились на три кластера. Кластер 1 объединяет в себя факты легко устанавливаемые в быту, а значит, и в условиях обучения. В кластер 3 входят факты, которые невозможно установить на уроке, следовательно, и в повседневной жизни. Кластер 2 содержит факты, для установления которых требуется учебное оборудование, вследствие чего они могут быть установлены в школе или вузе. Вероятность их установления в повседневной жизни меньше, чем у фактов, составляющих кластер 1, из-за отсутствия требуемого оборудования, а также мотива, специальной установки на изучение и т.д.
Аналогичная картина наблюдается на рис.2, соответствующая результатам экспертизы 2 с 15 экспертами. На нем хорошо выражен кластер 2, объединяющий в себе факты, которые можно экспериментально установить в условиях обучения, но невозможно установить в повседневной жизни.
Как видно из рис.4, вся совокупность фактов в пространстве признаков распадается на два кластера: в одном -- факты, устанавливаемые на уроке физики, сложность умозрительного изучения которых мала. Во втором -- факты, неустанавливаемые в условиях обучения, достаточно сложные, с точки зрения умозрительного изучения. Аналогичным образом можно интерпретировать распределение объектов по признакам и (рис.3).
Таблица 1
РЕЗУЛЬТАТЫ КЛАССИФИКАЦИИ ФИЗИЧЕСКИХ ФАКТОВ |
КЛАСТЕР 1. Координаты центра: |
Факты первой категории, которые могут быть установлены учащимися в повседневной жизни и в условиях обучения. Сложность их умозрительного изучения мала. |
Примеры: Факты существования явлений отдачи, инерции, атмосферного давления, сил тяжести, Архимеда, сухого и вязкого трения, механических автоколебаний и резонанса, отражения механических волн, сил поверхностного натяжения, смачивания и несмачивания, испарения и конденсации, диффузии, расширения тел при нагревании, конвекции, электростатического взаимодействия, электрического тока в газах, нагревания проводника при протекании тока, отражения и преломления света, излучения и распространения радиоволн, заряда и разряда конденсатора, излучения, поглощения, отражения, преломления и дисперсии света. |
КЛАСТЕР 2. Координаты центра: |
Факты второй категории, которые не могут быть установлены учащимися в повседневной жизни, однако, возможно их экспериментальное изучение на уроке физики в школе. Сложность их умозрительного изучения имеет промежуточное значение. |
Примеры: Факты существования гироскопического эффекта, явления всасывания тела в поток жидкости или газа, интерференции механических волн, нераспространения звука в вакууме, акустического эффекта Доплера, молекул, их взаимодействия, броуновского движения, электростатической индукции, сил Ампера и Лоренца, поляризации вещества, электролиза, термоэлектронной эмиссии, катодных лучей, самоиндукции, электрического резонанса, электромагнитной индукции, протекания переменного тока через конденсатор, отражения и интерференции радиоволн, интерференции, дифракции и поляризации света, лазерного эффекта, внешнего фотоэффекта, радиоактивности. |
Эмпирические законы: второй закон Ньютона, закон сохранения момента импульса, независимость ускорения свободного падения тела от его массы, закон Бернулли, пропорциональность давления отношению температуры к объему, закон Ома, пропорциональность сопротивления металлов температуре, зависимость сопротивления полупроводника от температуры. |
КЛАСТЕР 3. Координаты центра: |
Факты третьей категории, которые не могут быть экспериментально установлены учащимися ни в повседневной жизни, ни и в условиях обучения. Сложность их умозрительного изучения велика. |
Примеры: Факты существования релятивистского замедления времени, сверхпроводимости, дисперсии радиоволн, оптического эффекта Доплера, давления света, тормозного рентгеновского излучения, дифракции рентгеновских лучей, проникновения рентгеновских лучей через диэлектрик, эффекта Комптона, интерференции и дифракции электронов, радиоактивности, ядерной реакции, нейтрона, альфа, бета и гамма излучения, массивного положительного атомного ядра. |
На рис.5 приведено облако точек, соответствующее распределению фактов в трехмерном пространстве признаков и Кластеризация фактов по этим трем параметрам на основе данных, полученных во второй экспертизе, позволяет подтвердить предложенную в [9] классификацию, согласно которой физические факты могут быть разделены на три категории:
1. Факты, которые могут быть экспериментально установлены учащимися в повседневной жизни.
2. Факты, которые невозможно экспериментально установить в повседневной жизни, но можно установить в условиях обучения.
3. Факты, которые не могут быть экспериментально установлены в условиях обучения.
В таблице 1 приведены списки фактов, входящих в первую, вторую и третью категории. С ее помощью можно определить, к какой категории относятся и другие физические факты, не рассматриваемые в данной работе.
Автор выражает благодарность В.Ю.Дерябину за помощь в написании программ.
ЛИТЕРАТУРА