Ирина Соколова – Социальная информатика (страница 7)
Всякую ли мысль или знание можно выразить в языковой форме? По-видимому, нет. Например, существует множество определений таких понятий, как здоровье, счастье, любовь, дружба, интеллект, информация и т. п.
Мысль, которую нельзя выразить в языковой форме, не может быть включена в информационный обмен. Общение людей, таким образом, осуществляется с помощью языка как формы представления знаний. Одному и тому же содержательному знанию можно придать различную словесную форму, что проявляется в художественной прозе, поэзии и т. д. Богатство языка – это одновременно и богатство культуры того или иного народа.
Вместе с тем в различных сферах профессиональной деятельности это богатство и разнообразие выразительных средств естественного языка становится недостатком, а иногда – недопустимо, например, в армии, медицине, судопроизводстве и т. д.
В специальных отраслях науки формируются специфические языковые системы, являющиеся «сужением» естественного языка. Особо выделяется язык математики, как некоторая основа изложения системы знаний в точных, естественных науках. Свой язык имеют также химия, физика, философия, социология, педагогика, экономика, юриспруденция, психология и другие направления.
Целесообразность применения таких суженных языковых систем высока, они позволяют повысить надежность информационного обмена, так как возможность неправильного истолкования передаваемой информации существенно снижается. Главные достоинства такого языка – возможность создавать и использовать типовые упаковки знаний, а также в значительной мере снять
При этом, конечно, сужается и круг получателей, поскольку для восприятия информации необходимо владеть соответствующим языком – это, условно говоря, можно считать недостатком суженого языка.
Полисемия – основная проблема языковой формы информационного обмена, фактор внесения искажения и ошибок (семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных направлений в разработке формальных приемов представления знаний. Создание языка науки или языка деловой прозы, называемого часто «канцеляритом», является естественным шагом на этом пути. «Канцелярит» предназначен для объективизации изложения информации, использует, как правило, переводимые категории и языковые формы, лишен синонимии, оперирует конкретными фактами и понятиями, не избыточно информативен и логичен.
Все перечисленные выше свойства не присущи литературному языку, которому свойственна субъективность форм, возможность применения непереводимых конструкций, бесконечно богатая синонимия, образность высказываний и т. д.
Продвижение в сторону формализации знаний приводит к понятиям «класс» и «классификация».
В контексте информатизации общества ставится, например, вопрос о необходимости анализа и построения логических моделей сети Интернет с целью более полного извлечения содержащейся в нем информации: не фактической, как это делается в настоящее время, а аналитической, не представленной в сети явным образом[50].
Рассмотрим основные системы классификации знаний:
Классификация как метод научной систематики играет важную роль в формировании ядра знаний того или иного научного направления. Классификационные системы такого типа имеют выраженную иерархическую структуру, в которой все объекты (понятия, факты) разделены на уровни, связанные между собой отношением «старший – младший».
Классификация может проявить себя не только как инструмент организации научных знаний, но и как фактор социального порядка, способствующий активизации социальных отношений. Так, существующие системы тарифов и ставок, ученых степеней и званий, структура должностей и служебных постов в гражданской службе и армии играют не только организующую, но и стимулирующую роль. Подобная модель классификации знаний получила в науке и практике название иерархической.
Достоинства данной системы классификации заключаются в том, что она проста в освоении, легко обновляется и эффективно решает задачу разнесения новых понятий по иерархическим уровням.
Недостатки иерархической модели знаний: прямые связи между понятиями соседних уровней обозначены слабо, или вовсе отсутствуют; иерархическая классификация наиболее эффективна, когда при переходе от уровня к уровню работает один и тот же тип отношений, например, родовидовой.
Систематика, лежащая в основе классификации, может применяться как сильное средство исследования. Так, иногда оказывается полезным при рассмотрении группы объектов выделить несколько характерных для них признаков в качестве определяющих и ввести меру степени их проявления. Подобный подход называется
Упомянутые выше недостатки иерархической модели классификации свойственны и морфологическим моделям. Их удается устранить, используя так называемые
Отдельные понятия, факты, знания, связаны между собой отношениями, выражающими суть имеющихся между ними связей. Как и в иерархической модели, это могут быть
В древовидной структуре можно прослеживать восходящие и нисходящие ветви связей, делая как индуктивные (от частного к общему) и дедуктивные (от общего к частному), так и индуктивно-дедуктивного выводы.
Благодаря такой организации представленные знания получают как дополнение к декларативности процедуральность, т. е. способность к выводу общих знаний из структуры отношений и понятий. Древовидная структура знаний, несмотря на ее простоту и распространенность в информационном обмене, все-таки специфична. В ней, как и в предыдущей модели знаний, заложена парадигма иерархичности. В то же время некоторая система знаний может не соответствовать этой парадигме.
Например, совокупность знаний, описывающих конкретный трудовой коллектив, многоаспектна, и часто не удается установить отношения иерархии (род-вид), хотя связь между ними имеет место. Вот один из возможных аспектов: все представители трудового коллектива могут быть включены в алфавитный список с указанием табельного номера, года рождения, специальности и т. п. – «Список 1». Другой аспект: все члены коллектива работают на условиях сдельной оплаты, и величина их заработка определяется единой тарифной сеткой. Поэтому список специальностей и разрядов с указанием стоимости часа рабочего времени дает представление о системе оплаты труда. Назовем этот список – «Список 2». Третий аспект: при начислении зарплаты необходимо учитывать фактическую выработку работника на протяжении некоторого периода. Поэтому список, состоящий из табельных номеров и фактически проработанного каждым времени, – это «Список 3».
Все три списка содержат необходимый объем знаний о трудовом коллективе в контексте начисления заработной платы. Подобные модели представления знаний, состоящие из связанных списочных структур, получили название реляционных[52].
В