скачать РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ФИЗИЧЕСКОЙ КУЛЬТУРЫ, СПОРТА И ТУРИЗМА _________________________________________________________ В.Г. Конюхов, Е.Н. Яшкина ИНФОРМАТИКА Учебное пособие Москва - 2006 РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Ф ИЗИЧЕСКОЙ КУЛЬТУРЫ, СПОРТА И ТУРИЗМА _________________________________________________________ В.Г. Конюхов, Е.Н. Яшкина ИНФОРМАТИКА Учебное пособие Рекомендовано Учебно-методическим объединением по образованию в области физической культуры и спорта в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению 032100 «Физическая культура» и специальности 032101 «Физическая культура и спорт» ^ УДК 519.6 К 64 Рекомендовано Учебно-методическим объединением по образованию в области физической культуры и спорта и одобрено в качестве учебного пособия для высших учебных заведений, обучающихся по направлению 032100 «Физическая культура» и специальности 032101 «Физическая культура и спорт» Конюхов В.Г., Яшкина Е.Н. Информатика : учебное пособие для студентов высших учебных заведений ; РГУФК. - М., 2006. – 147 с. ^ Яшкина Е.Н. – канд. пед. наук, доц. кафедры естественно-научных дисциплин и информационных технологий РГУФК. Рецензент: Шалманов Ан. А. – д-р пед. наук, профессор кафедры биомеханики РГУФК. Авторы-составители:^Яшкина Елена Николаевна – кандидат педагогических наук, доцент, доцент кафедры естественно-научных дисциплин и информационных технологий РГУФК.В учебном пособии представлены теоретические основы информатики и методы ее практического использования в профессиональной деятельности. Содержание учебного пособия соответствует требованиям Государственного образовательного стандарта. Учебное пособие адресовано студентам высших учебных заведений физической культуры. © Конюхов В.Г., Яшкина Е.Н., 2006. © Российский государственный университет физической культуры, спорта и туризма, 2006. ПРЕДИСЛОВИЕ Стремительное развитие информационных технологий не могло не сказаться на системе высшего образования. Информационные технологии входят как составляющие в большое число дисциплин, они стали необходимыми инструментами учебной и профессиональной деятельности. Как следствие этого, изучение информатики стало в настоящее время обязательной частью учебных планов всех высших учебных заведений. Настоящий учебник предназначен для студентов вузов физической культуры дневных и заочных факультетов. Содержание вошедшего в учебник материала полностью соответствует требованиям (федеральный компонент) к обязательному минимуму содержания и уровню подготовки бакалавра по циклу ЕН Государственного образовательного стандарта высшего профессионального образования второго поколения. В состав учебника вошли как теоретические основы информатики, так и обзор современных программных средств. В краткой и доступной форме описаны основные особенности работы с современными прикладными программами. Материал учебника может быть использован для самостоятельного изучения предмета. Лаконичность изложения позволит разобраться в тех случаях, когда это достаточно сложно осуществить с помощью специализированной литературы. Авторы выражают надежду, что данный учебник поможет не только освоить дисциплину «Информатика» и успешно подготовиться к сдаче экзамена, но и научиться использовать ее возможности в своей повседневной жизни. ^ 1.1. Понятие информации Термин информация происходит от латинского слова informatio, что означает разъяснение, осведомление, изложение. Несмотря на чрезвычайно широкое применение этого термина, дать строгое определение понятию «информация» оказывается крайне проблематичным. С точки зрения рассматриваемой науки понятие информации является первичным и, следовательно, неопределимым. Совершенно так же, как понятия «точка», «прямая», «множество» являются основными неопределяемыми понятиями в математике. Опишем понятие «информации» исходя из ее свойств. Информация является отражением реального мира. Человек получает сведения об окружающем его мире, воспринимая сигналы, возникающие в результате взаимодействия физических объектов друг с другом. Сигналом является физический процесс или явление, несущий сообщение о состоянии объекта наблюдений или каком-либо событии. Как правило, сигналы изменяются с течением времени. Каждый сигнал имеет параметры, которые используются для его характеристики (описания). По форме сигналы разделяются на непрерывные (аналоговые) и дискретные. Сигнал называется непрерывным, если его параметр является непрерывной во времени функцией. Если же параметр сигнала может принимать только ряд значений, причем их конечное число, то сигнал называется дискретным. Подавляющее большинство явлений окружающего мира представляются непрерывными процессами, характеризующимися плавным изменением их характеристик. В то же время обрабатывать удобнее дискретные сигналы. Преобразование непрерывного сигнала в дискретный называется квантованием, а дискретного в непрерывный – сглаживанием. Хорошо известным примером таких преобразований является съемка какого-либо процесса на кинокамеру и последующий просмотр. Зарегистрированные на материальном носителе сигналы называются данными. Данные могут храниться и транспортироваться на носителях различных видов. Носитель - это среда для записи и хранения данных. От свойств носителя зависят полнота, доступность и достоверность информации при последующем использовании. В настоящее время известно большое число способов регистрации сигналов - механические воздействия, изменения электрических, магнитных, оптических характеристик носителя, его химического состава, кристаллической структуры и т.д. Самым распространенным носителем информации до сих пор является бумага, регистрация сигналов на которой осуществляется с помощью изменения оптических свойств. В качестве носителей используются различные материальные предметы (бумага, камень, дерево, диски и т.д.). К машинным носителям информации относятся магнитные диски, магнитные ленты, оптические диски и т.д. Информация о явлениях и объектах окружающего мира содержится в данных, однако не следует отождествлять два этих понятия. Действительно, один и тот же набор данных может восприниматься разными людьми совершенно по-разному. Например, для музыканта партитура является образом музыкального произведения, а для человека, не владеющего нотной грамотой, - набором витиеватых иероглифов. Для получения информации по имеющимся данным необходимо использование методов, преобразующих данные в воспринимаемые человеческим сознанием понятия. Методы, в зависимости от результата их применения, можно разделить на адекватные и неадекватные. Например, человек, не знающий нотной грамоты, применяет неадекватный метод, пытаясь разобрать партитуру. Исходя из сказанного, можно дать описательное определение информации как результата применения к данным адекватных методов. Информация является динамическим объектом, который появляется и существует во время взаимодействия данных и соответствующих им методов. При всем многообразии информацию можно классифицировать по ряду признаков. Принято различать следующие виды информации:
^ Как всякий объект информация обладает большим количеством разнообразных свойств. Наиболее важными, с точки зрения рассматриваемой дисциплины, являются такие ее свойства, как полнота, объективность, достоверность, дуализм, актуальность, доступность и полезность. Остановимся более детально на каждом из них.
^ Рассмотренное ранее свойство полноты информации подразумевает, что информацию можно измерять количественно. Для того чтобы понять, как определить количество информации в данном конкретном сообщении, рассмотрим связь понятий информация, неопределенность и возможность выбора. Решение разнообразных задач, выбор и принятие решений происходит в процессе постепенного устранения неопределенностей, содержащихся в исходных условиях, на основе получения и использования информации об окружающем мире. Получение человеком информации приводит к уменьшению неопределенности, снижая тем самым число возможных вариантов выбора, а наличие полной информации позволяет однозначно решить поставленную задачу, не оставляя вариантов выбора. Однако одно и то же сообщение несет для разных людей разное количество информации, поскольку уровень новизны и ценности полученной информации оказывается для них различным. Например, если передаваемые сведения не относятся к рассматриваемому вопросу, или же были уже известны человеку, то после их получения неопределенность остается прежней, и, следовательно, информация не была получена – ее количество равно нулю. Если же после получения сообщения неопределенность снята и достигнута полная ясность в рассматриваемом вопросе, то полученная информация является исчерпывающей и ее количество равно исходной неопределенности. Исходя из сказанного, можно определить количество информации как числовую характеристику информации, отражающую ту степень неопределенности, которая пропадает в результате получения сообщения. Базовая единица измерения информации получила название бит (bit) – аббревиатура английских слов binary digit, переводящихся как двоичная цифра. За один бит принято количество информации, содержащееся в сообщении о событии, имеющем два равновозможных исхода. Иными словами, бит равен количеству информации в ответе на вопрос, допускающий лишь односложный ответ - «да» или «нет». При получении количества информации в один бит число вариантов выбора или, иными словами, неопределенность, уменьшается в два раза. При практическом применении оказывается, что бит является слишком маленькой единицей измерения количества информации. Поэтому в информатике часто используется единица измерения, получившая название байт (byte), которая равна 8 битам. Использование одного бита позволяет выбрать один вариант из двух возможных, а байт - 1 из 256 (28). Помимо этого, для измерения количества информации используются более крупные единицы: 1 Кбайт (один килобайт) = 2 10 байт = 1024 байта; 1 Мбайт (один мегабайт) = 2 10 Кбайт = 1024 Кбайта; 1 Гбайт (один гигабайт) = 2 10 Мбайт = 1024 Мбайта. Использование битовой (двоичной) единицы информации, а не какой-либо другой связано с аппаратным устройством компьютеров. Основные элементы его памяти базируются на двоичном принципе: оперативная память – есть заряд на обкладках конденсатора или нет, дисковая – намагничена данная область или нет. ^ Информационным процессом называется процесс обработки данных соответствующими им методами. Информационные процессы, связанные с получением информации, могут быть разделены на несколько отдельных видов: поиск, сбор, хранение, передача, обработка, использование и защита данных.
^ Слово информатика состоит из корня inform - «информация» и суффикса matics — «наука о...», поэтому при дословном переводе информатика — это наука об информации. Поскольку в настоящее время информатика является достаточно молодой и динамично развивающейся наукой, то единого ее определения пока не сформулировано и разные авторы подходят к нему с различных позиций. Исходя из прикладной направленности рассматриваемого курса, отдадим приоритет изучению организации и реализации информационных процессов с использованием компьютерных технологий. С этих позиций можно дать следующее определение. Информатика – это наука, изучающая свойства, структуру и функции информационных систем, основы их проектирования, создания, использования и оценки, а также информационные процессы, в них происходящие. Исходя из данного определения, в структуре информатики можно выделить три раздела, изучающие соответственно: • методы организации информационных процессов с помощью компьютерных систем; • аппаратное обеспечение компьютерных систем; • программное обеспечение компьютерных систем. В части методов организации информационных процессов информатика рассматривает вопросы: • представления различных типов данных в виде, удобном для компьютерной обработки; • сжатия и восстановления данных; • разработки и реализации методов хранения данных, обеспечивающих удобство доступа к ним. В этой части информатика опирается на достижения таких наук, как теория информации, математическая логика, статистика, теория кодирования и др. Раздел аппаратного обеспечения посвящен изучению состава, структуры и принципов функционирования вычислительных систем. Он базируется на основах таких наук, как кибернетика, автоматика и электроника. В этой части информатики рассматриваются: • принципы построения элементов цифровых устройств; • принципы действия цифровых вычислительных устройств; • принципы работы систем, предназначенных для автоматической обработки данных; • аппаратная конфигурация отдельных компьютеров и компьютерных сетей. В разделе программного обеспечения рассматриваются методы управления компьютерной техникой. Всей работой компьютера управляют программы, указывающие последовательность действий, которые компьютер должен выполнить при обработке данных. Этот раздел информатики опирается на научные положения теории алгоритмов, логики, теории графов, теории игр и т.д. и посвящен изучению: • взаимодействия аппаратного и программного обеспечения; • интерфейса, обеспечивающего взаимосвязь пользователя с аппаратным и программным обеспечением; • программного обеспечения компьютеров. По своей сути информатика является практической наукой, предметом которой является не только описательное изучение названных вопросов, но и разработка методов их решения. Для достижения этой цели используются научные достижения многих смежных наук. Вопросы для самоконтроля к разделу 1
^ 2.1. Системы счисления Система счисления – способ наименования и изображения чисел с помощью символов, имеющих определенные количественные значения. В зависимости от способа изображения чисел системы делятся на позиционные и непозиционные. В непозиционной системе счисления для записи числа используется бесконечное множество символов, и символы не меняют своего количественного значения при изменении их расположения в числе. В качестве примера непозиционной системы счисления можно привести римскую систему счисления. В этой системе для отображения числа один используется символ I, для чисел два и три - последовательности символов II, III. Число пять отображается символом V, а числа четыре и шесть — комбинациями символов IV и VI соответственно. Для числа десять вводится новый символ X, числа сто — С т.д. Существенными недостатками непозиционных систем счисления является бесконечное число символов для записи чисел при их реализации и сложность правил арифметических действий. В позиционной системе счисления для записи чисел используются ограниченный набор символов, называемых цифрами, и количественное значение каждой цифры зависит от местоположения (позиции) в записи числа. Например, числа 256 и 625 не равны между собой, хотя и составлены из одинаковых цифр. В числе 256 имеется две сотни, пять десятков и шесть единиц 256=2*100+5*10+6. Позиционная система счисления определяется ее основанием, т.е. количеством цифр, используемых для изображения числа. В десятичной позиционной системе счисления для записи любого числа используется десять цифр (основание системы 10). В позиционной системе счисления каждое число может быть представлено в виде полинома по степеням основания: 256=2*102+5*101+ 6*100. Двоичная система счисления также является позиционной с основанием 2. Таким образом, любое число в двоичной системе счисления, согласно правилу, можно представить в следующем виде: 1102=1*22+1*21+0*20. Для перевода десятичного числа в двоичную (или другую) систему счисления можно применить способ деления на основание той системы счисления, в которую переводится число. В качестве примера переведем число 6 в двоичную систему: 6:2=3, остаток 0, поэтому можно записать 6=3∙21+0∙20. Делим полученное частное (3) на основание: 3:2=1, остаток 1, 3=1∙21+1∙20. Тогда 6(10)=(1∙21+1∙20)∙21+0∙20=1∙22+1∙21+0∙20=110(2). Согласно рассмотренному правилу, число в двоичной системе счисления может быть получено в результате записи частного и остатков от последовательного деления в порядке, обратном получению. На основании вышесказанного можно записать несложную таблицу перевода (табл. 2.1). Таким образом, любое число можно представить в двоичном виде, т.е. с помощью двух цифр 0 и 1. ^
При переводе двоичного числа в десятичное суммируются веса тех разрядов числа, где присутствует 1: 11102 = 23 +22 +21 = 1410. Помимо двоичной системой счисления, в информатике нашли широкое применение восьмеричная и шестнадцатеричная системы счисления. Актуальность их использования связана с тем, что запись числа в двоичной системе счисления примерно в 3,3 раза длиннее записи этого же числа в десятичной системе счисления, что весьма неудобно для использования человеком. Длина записи чисел в восьмеричной системе короче в три раза, а в шестнадцатеричной - в четыре раза по сравнению с двоичной, а длины чисел в восьмеричной, десятичной и шестнадцатеричной системах счисления отличаются не сильно. Перевод чисел из двоичной системы счисления в восьмеричную и шестнадцатеричную и обратно существенно проще, нежели чем перевод из двоичной в десятичную и обратно. В восьмеричной системе счисления используются первые восемь цифр десятичной (01234567). В шестнадцатеричной системе используются шестнадцать цифр, из них первые 10 совпадают с цифрами десятичной системы счисления, а шесть оставшихся отображаются с помощью больших латинских букв (0123456789АВСDЕF). ^ Приведение данных к форме, в которой они могут быть обработаны с помощью вычислительных систем, имеет свои особенности, связанные с устройством и функционированием электронных схем. В электронике достаточно просто реализуются схемы с двумя устойчивыми состояниями, для идентификации которых можно использовать два символа – 0 и 1. Например, есть заряд на обкладках конденсатора или нет, намагничен участок поверхности или нет, есть ток или нет. На таких принципах строится, например, оперативная и дисковая память компьютера. Исходя из этого, в качестве универсальной формы представления данных для компьютерной обработки может быть использовано представление данных в двоичном виде. Оно предполагает, что для хранения данных используется упорядоченная совокупность ячеек, каждая из которых может находиться в одном из двух состояний, отображаемых с помощью символов 0 и 1. Тогда с помощью двух двоичных ячеек (двух бит) можно закодировать 22 = 4 различные комбинации кодов – 00, 01, 10, 11, с помощью трех бит - 23 = 8 комбинаций, а восьми бит или 1 байта - 28 = 256. Для компьютерной обработки данных разнообразных видов необходимо определить универсальную систему кодирования. Напомним, что кодированием называется отображение состояния одной физической системы с помощью состояния другой. В более узком смысле, характерном для информатики, под термином «кодирование» необходимо понимать переход от одной формы представления данных к другой, более удобной для хранения, передачи или обработки. Поскольку внутреннее представление данных в компьютере должно осуществляться с помощью всего лишь двух символов (0 и 1), то возникает задача представления всех данных: числовых, символьных, звуковых, графических, видео и др. с помощью этих двух символов, т.е. с помощью двоичной системы счисления. Особенность представления данных в вычислительных системах связана с тем, что в памяти компьютера они должны размещаться в байтах, являющихся минимальными по размеру адресуемыми ячейками памяти. Под адресуемостью понимается возможность обращения к данному участку памяти. Если для представления набора данных необходим объем, превосходящий один байт, то для хранения этих данных будет отведена последовательная группа байт. Адресом данных будет являться адрес первого байта, а в каждом байте будет записываться соответствующий код из восьми двоичных разрядов. Задача кодирования данных заключается в том, чтобы определить правила их записи в одном байте или последовательности байт. Для представления основных видов данных используются абстракции специального вида, называемые типами данных. Каждому типу данных соответствуют строго определенная структура представления данных и методы их обработки. Необходимо отметить, что при проведении компьютерной обработки постоянно решается и обратная задача, заключающаяся в воспроизведении исходных данных по записанным кодам. ^ Используемые в человеческой практике числа имеют чрезвычайно различные характеристики - разные типы (натуральный, целый, рациональный, комплексный) и точности, что требует различного количества байтов для их отображения в памяти компьютера. Поэтому единой оптимальной для всех чисел формы представления не существует. Исходя из этого, все множество чисел разделяется на типы, каждый из которых имеет свою собственную форму представления. Например, целые числа в определенном диапазоне, действительные с плавающей точкой с заданным количеством значащих цифр, и т.д. Целые положительные числа в диапазоне от 0 до 255 могут быть представлены в двоичном коде с помощью перевода в двоичную систему счисления. В памяти компьютера для такого представления потребуется один байт. При представлении целых положительных и отрицательных чисел для кодирования знака используется отдельный, обычно старший, бит. С помощью нуля отображается знак плюс, а единицы - минус. Оставшиеся семь бит используются для представления цифр, что позволяет закодировать с помощью одного байта целые числа в интервале от -127 до +127. Описанный способ представления получил название прямого кода. Его недостатком является неоднозначность представления числа ноль (числу ноль соответствуют два кода 0000 0000 и 1000 0000), приводящая к усложнению арифметики и требующая соответствующего решения на аппаратном уровне. Указанный недостаток можно устранить с помощью использования так называемого дополнительного кода. В соответствии с ним положительные числа отображаются так же, как и в прямом коде, а отрицательные – с помощью числа, получающегося в результате вычитания из 1 0000 0000 их модуля. Например, числу - 3 соответствует код 1111 1101= 1 0000 0000 - 0000 0011. Достоинством дополнительного кода является простота реализации арифметических действий, поскольку каждый последующий код получается из предыдущего прибавлением единицы. В целях оптимизации использования ресурсов компьютера во всех системах программирования используется несколько типов данных для работы с целыми числами. Например, в системе программирования Delphi5, основанной на языке Паскаль, их девять. Рассмотренные выше представления называются Byte и ShotInt. Совершенно аналогично целые числа от 0 до 65535 (Word) и целые числа от - 32768 до 32767 (SmallInt) представляются с помощью двух байт в двоичной системе счисления. Действительные числа, с точки зрения математики, являются конечными или бесконечными дробями, длина и соответственно точность которых не ограничена. Поскольку для представления чисел в компьютерах используются один байт или же последовательность байт, имеющих ограниченные количества разрядов, то и бесконечные, и просто «длинные» числа ограничиваются до некоторой длины и в компьютерном представлении являются приближенными. Существуют две формы записи действительных чисел:
Для представления действительных чисел в компьютерах разработано несколько стандартных форматов, имеющих одинаковую структуру и различающихся по точности. В каждом из них в первом разряде представления записывается знак мантиссы. Расположенная за ним последовательность разрядов фиксированной длины предназначена для хранения порядка числа. Оставшаяся группа разрядов, тоже фиксированной длины, содержит абсолютную величину мантиссы. Диапазон представляемых с помощью такого формата чисел определяется числом разрядов, отведенных для хранения порядка, а точность представления чисел - количеством разрядов, предназначенных для записи мантиссы. Для отображения порядка числа используется представление с избытком, при котором вместо истинного значения порядка хранится число, называемое характеристикой и получаемое путем прибавления к порядку необходимого смещения. Так, например, если для отображения порядка используется восемь бит и, следовательно, его значения лежат в диапазоне - 128 до + 127, то смещение равно 128. Отображение порядка в этом случае осуществляется с помощью неотрицательных чисел, лежащих в диапазоне от 0 до 255. Причинами использования смещенной формы представления порядка является упрощение выполнения операций как над порядками, так и над самими числами, поскольку в этом случае возможно выполнение действия с порядками, как с положительными числами. Аналогично целым числам при практической реализации в системах программирования применяется несколько типов данных, основанных на модели чисел с плавающей точкой. Например, в языке Паскаль системы программирования Delphi 5 используется 7 типов данных разной «длины». Так, тип Real позволяет оперировать с числами из диапазона 5.010-324 1.710308, имеющими 15 значащих разрядов и требующих для своего хранения 8 байт памяти, а тип Single предназначен для работы с числами из диапазона 1.510-45 3.41038, имеющими 7 значащих разрядов и занимающих 4 байта. ^ Все множество символьных данных можно разделить на символы, символьные строки и текстовые документы. Двоичное кодирование символьных данных осуществляется с помощью кодовых таблиц, ставящих в соответствие каждому символу одно- или двухбайтовый код. Задача интерпретации кодов затруднена тем, что для каждого языка, как правило, существуют несколько кодовых таблиц. Обусловлено это тем, что кодировки разрабатывались в разные времена в разных странах. Рассмотрим наиболее распространенные кодовые таблицы. Кодовая таблица АSСП (American Standart Code for Information Interchange) разработана институтом стандартизации США в 1981 г. Для хранения каждого символа в ASCII используется восемь бит или один байт, что позволяет закодировать 28 = 256 различных символов. Первоначально таблица состояла из 128 элементов, отображающих специальные управляющие знаки, такие как перевод строки, пробел, табуляция и т. д., спецсимволы, знаки арифметических действий, знаки препинания, цифры и буквы латинского алфавита. Эта часть таблицы (с 0 по 127 элемент) получила название основной, или базовой. Старший разряд каждой восьмибитовой последовательности не использовался и был равен нулю. Использование старшего бита позволило кодировать при помощи АSСП символы национальных языков и среди них — кириллицы. Эта часть таблицы (с 128 по 255 элемент) называется расширенной, или дополнительной. АSСП является родоначальником класса так называемых «однобайтовых» кодировок - первые 128 элементов всех современных однобайтовых кодировок полностью совпадают с последовательностью элементов АSСП. Кодировка КОI8 (код обмена информации восьмибитовый) была разработана в середине семидесятых годов специалистами одного из советских НИИ. Кодировка КОI8 была принята Госстандартом СССР в качестве базовой спецификации для обмена электронными документами на русском языке и ей было присвоено соответствие стандарту ГОСТ 19768-74. На сегодняшний день КОI является одной из основных кодировок для серверов, работающих на базе платформы UNIX (например, для http-сервера Арасhе), и широко используется в качестве принятого в российском Интернете формата для сообщений электронной почты. После развала Советского Союза КОI8 преобразовалась в две отдельные кодовые таблицы КОI8-R и КОI8-U, использующиеся для представления символов русского и украинского языков. Кодировка Windows-1251 была разработана компанией Microsoft. Она получила широкое распространение благодаря популярности операционной системы Microsoft Windows и http-сервера IIS(Internet Information Server). Кодовые таблицы серии ISO-8859 были разработаны Международной организацией по стандартизации (International Standards Organization) с целью унификации представления символов национальных языков в электронной форме. ISO была создана система кодировок серии 8859, каждая из которых предназначена для отображения символов того или иного национального алфавита: для русского ISO-8859-5, для латинского алфавита ISO-8859-1, для арабского ISO-8859-6 и т.д. Кодировка Macintosh CP (MAC) создавалась в расчете на персональные компьютеры Арр1е Macintosh, работающие под управлением операционной системой МасОS. Кодировка Unicode и ее разновидность UTF-8 были разработаны с целью объединения всех существующих национальных кодировок в одну. В этих кодовых таблицах для отображения каждого символа используется два байта, что позволяет описать 65 536 символов, а не 256, как ранее. В их число входят цифры, буквы латинского и многих национальных алфавитов, спецсимволы, знаки арифметических операций и т.д. Кодировка Unicode используется в качестве основной кодировки в операционной системе Microsoft Windows ХР. Все документы в кодировке Unicode вдвое длиннее, что сначала затрудняло ее внедрение. Символьные строки, по-другому называемые текстовыми, представляют собой последовательность символов. По характеру своего содержания они могут быть как произвольными наборами символов, используемыми, например, в качестве паролей или названий переменных в программировании, так и осмысленными словами и даже целыми текстами. Символьная строка характеризуется длиной - количеством содержащихся в ней символов. Представление символьной строки для компьютерной обработки может быть реализовано в виде набора данных, в начале которого записана длина строки, а затем – само содержание строки. Текстовые документы являются одним из главных источников информации. Простейшим способом представления текстового документа является символьная строка. Однако не структурированный на логические фрагменты документ, представленный в виде сплошного текста, труден для восприятия. Для облегчения восприятия документа при его отображении используются шрифты различных типов и цветов, текст документа разбивается на абзацы, параграфы, главы. Структурирование текста - взаимное расположение его частей при отображении на экране монитора или печати в специальном виде, удобном для пользователя, называется форматированием. Форматирование текста осуществляется с помощью управляющих символов - тегов, по-другому называемых маркерами, которые хранятся в наборе данных вместе с основным текстом. Обрабатывающие текстовые документы программы форматируют тексты, считывая и обрабатывая теги разметки. ^ Напомним, что звук представляет собой упругую продольную волну, распространяющуюся в воздушной среде. Преобразование данных звукового сигнала к виду, пригодному для компьютерной обработки, производится в два этапа. На первом этапе звуковой сигнал с помощью микрофона преобразуется в электрический аналог звука. Последний имеет непрерывную форму и потому не может обрабатываться компьютером непосредственно. На втором этапе сигнал преобразуется в цифровой код с помощью аналого-цифрового преобразователя. В случае воспроизведения звуковых данных происходит обратное цифро-аналоговое преобразование. И аналого-цифровое, и цифро-аналоговое преобразования осуществляются в звуковой карте компьютера. При оцифровке производится квантование сигнала как по времени, так и по уровню. Для квантования по времени все время звучания обрабатываемого сигнала разбивается на малые интервалы времени продолжительностью Δt. Величина ν = 1/Δt называется частотой дискретизации. Она характеризует число измерений в течение единицы времени и имеет размерность частоты (Гц – герцы). При выполнении преобразования считается, что в течение каждого из промежутков Δt уровень сигнала изменяется мало и, следовательно, приближенно может быть принят постоянным. При квантовании по уровню весь диапазон изменения сигнала от минимального значения до максимального разбивается на равные промежутки - кванты, каждый из которых имеет свой порядковый номер. Если после квантования по времени уровень сигнала оказывается в промежутке с номером k, то ему ставится в соответствие код k. Для оптимальной оцифровки звукового сигнала необходимо решить два вопроса: какие частоту дискретизации и точность измерения сигнала следует выбрать для обеспечения требуемого качества сигнала при последующем воспроизведении. При выборе частоты дискретизации руководствуются теоремой Найквиста, согласно которой максимальная частота воспроизводимого сигнала не превосходит половины частоты дискретизации. При выборе числа квантов, определяющего точность измерения сигнала, исходят из требований к допустимому уровню шумов и искажений. ^ Применительно к компьютерам существуют три основных способа представления изображений – растровый, векторный и фрактальный. При использовании первого графические объекты формируются в виде множества точек (пикселей) разных цветов и разных яркостей, распределенных по строкам и столбцам. Во втором случае изображение описывается с помощью совокупности отрезков и дуг и т.д., и параметров, описывающих их цвета и расположение. Под вектором понимается набор данных, характеризующих какой-либо объект. Фрактальная графика, аналогично векторной, базируется на математических вычислениях. Отличие последней состоит в том, что все изображения строятся по уравнениям, поэтому никаких графических объектов в памяти компьютера хранить не надо. Базовым элементом фрактальной графики является сама математическая формула. Для кодировки графических данных необходимо измерить цвет, что может быть сделано на основании трех законов смешения, сформулированных Грассманом:
Все многообразие цветов в природе возникает благодаря двум механизмам. В первом случае источники света излучают свет различных длин волн, который и воспринимается глазом человека как цветной. Во втором случае свет, падая на поверхность несветящегося объекта, частично поглощается, а частично отражается, и отраженное излучение воспринимается глазом как окраска объекта. Для описания цвета в случаях излучающих и отражающих объектов применяются разные математические модели. Модель RGB описывает излучаемые цвета и использует в качестве базовых три цвета - красный (Red), зеленый (Green) и синий (Вlue). Все остальные цвета образуются в результате смешивания этих трех основных. Например, при смешивании красного и зеленого цвета получается желтый, зеленого и синего - голубой, синего и красного - пурпурный. Если смешиваются все три базовых цвета, то получается белый. Каждый составляющий цвет характеризуется своей яркостью. Смешав три базовых цвета с разными яркостями (т.е. в разных пропорциях), можно получить любой желаемый оттенок. Каждый пиксель растрового изображения в модели RGB представляется яркостями трех базовых цветов: красного, зеленого и синего. Яркости пикселей хранятся в каналах. Цветовым каналом называется полутоновое изображение, отражающее распределение яркостей соответствующего базового цвета. Модель RGB является трехканальной, требующей по одному на каждый базовый цвет. Яркость каждого базового цвета характеризуется целым числом, которое может принимать значения от 0 до 255. Модель RGB используется для создания графических образов в излучающих свет устройствах – телевизорах, мониторах. Цветная картина получается при наложении друг на друга изображений в красном, зеленом и синем канале. Каждый складывающийся цвет характеризуется своей собственной яркостью, и по мере увеличения яркости составляющих цветов увеличивается яркость результирующего, поэтому модель RGB называется аддитивной. Модель HSB является аппаратно-зависимой, поскольку в основе лежит модель RGB. Рассматриваемая модель получила свое название по первым буквам английских слов Hue (цветовой тон, тональность), Saturation (насыщенность), Brightness (яркость). В модели HSB каждый цвет определяется своим цветовым тоном, насыщенностью и яркостью. Таким образом, модель HSB, так же как и модель RGB, является трехканальной. Цветовой тон, или собственно цвет, соответствует чистому цвету солнечного спектра и характеризуется величиной, изменяющейся от 0 до 360. Совокупность чистых тонов имеют максимальную насыщенность и яркость. Насыщенность характеризует процент добавления цвета к цвету белой краски и изменяется от 0 до 100%. Если значение насыщенности становится равным 0%, то любой цвет становится белым. Яркость является параметром, описывающим освещенность и характеризующим процент добавления цвета к цвету черной краски. Она может изменяться в интервале от 0 до 100%. Уменьшение яркости цвета означает его затемнение, а минимальная яркость (0) соответствует черному цвету. Таким образом, любой цвет в модели HSB получается из спектрального путем добавления определенного процента белой и черной красок, иными словами, оттенка серого цвета. Следует отметить, что модель HSB является не совсем корректной с точки зрения человеческого восприятия, поскольку описание яркости в ней не соответствует восприятию человеческим глазом. Модель HSB использует предположение, что все спектральные цвета имеют 100-процентную яркостью, в то время как человеческий глаз воспринимает спектральные цвета, как имеющие различную яркость. Например, спектральный зеленый представляется наиболее ярким, красный - менее ярким, а синий - наиболее темным. Модель HSB широко используется компьютерными художниками благодаря простоте заложенных в нее идей, с ее помощью удобно визуально подбирать цвета. Модель CMYK является основной полиграфической моделью, когда напечатанные на бумаге изображения сами не излучают световых волн. Окрашенные изображения, освещаемые белым светом, поглощают все составляющие цвета, кроме того, цвет, который видит человек. Цвет поверхности получается с помощью красителей, которые поглощают, а не излучают. Цвета, полученные из белого цвета путем вычитания, т.е. поглощения, из него определенных участков спектра, называются субтрактивными. Для их описания удобно воспользоваться моделью CMY (Cyan (Голубой), Magenta (Пурпурный) и Yellow (Желтый)), в которой основные цвета получаются путем вычитания из белого цвета основных аддитивных цветов модели RGB. Основных субтрактивных базовых цветов три: голубой (белый минус красный), пурпурный (белый минус зеленый), желтый (белый минус синий). В результате смешивания двух субтрактивных составляющих результирующий цвет затемняется - положено больше краски, поглощено больше света. Смешивание максимальных значений всех трех компонентов в результате дает черный цвет. Отсутствие краски соответствует белому цвету, а смешение равных значений трех компонентов позволяет получить оттенки серого. На практике реальные краски не полностью соответствуют их теоретическим рассчитанным аналогам. Поэтому при смешивании трех основных красок вместо черного цвета получается грязно-коричневый. Помимо этого, достижение интенсивного черного цвета требует большого количества красителей каждого цвета, что может привести к их повышенному расходу, переувлажнению бумаги. Исходя из этого, к числу основных полиграфических красок (и в модель) была добавлена черная. Последняя буква в названии модели CMYK означает черную краску - последняя буква слова blacK (черный). Число базовых красок - каналов увеличилось до четырех, поэтому CMYK является четырехканальной цветовой моделью. Оцифровка изображения. Для представления графических данных к виду, пригодному для компьютерной обработки, обрабатываемое изображение с помощью объектива проецируется на светочувствительную матрицу, состоящую из строк и столбцов, и называемую растром. Каждый элемент матрицы состоит из трех светочувствительных датчиков красного, зеленого и желтого цветов, предназначенных для фиксации яркости этих трех основных цветов. Измеренные яркости точек оцифровываются по каждому из трех цветов последовательно по всем строкам растра. Для кодирования каждой точки растра могут использоваться данные, имеющие различное число разрядов. Кодирование яркости каждой точки с помощью одного байта на каждый из трех базовых цветов, то есть с помощью 3 • 8 = 24 битов, обеспечивает представление 224 16,7 миллионов распознаваемых цветов, что близко цветовосприятию человеческим зрением. Режим представления графических данных с помощью 24 двоичных разрядов называется полноцветным, или True Со1оr. Графические данные требуют для своего хранения очень большие объемы на носителях. Так, например, изображение, воспроизводимое на экране монитора с растром 800х600 точек в режиме True Со1оr, занимает 8006003=1440000 байт. Режим, при котором для кодирования одной точки растра используется два байта, называется High Color. Он позволяет различать 216 65,5 тысячи цветов. До того времени, как видеоадаптеры с большим объемом видеопамяти и мониторы SVGA получили широкое распространение, большинство компьютеров могли отображать на экране не более 256 цветов одновременно. А более старые мониторы вообще были способны воспроизводить до 16 или 64 цветов. В таких условиях наиболее рациональным способом кодирования изображений явился метод индексирования цветов. При его использовании для кодирования одной точки растра используется один байт, поэтому количество цветов в нем ограничено 256. Каждому из цветов, использующихся в изображении, ставится в соответствие порядковый номер, который затем используется для описания всех точек (пикселей), имеющих такой же цвет. При этом код каждой точки изображения характеризует не собственно цвет, а некоторый номер цвета, или индекс, из таблицы цветов, которая получила название палитры. Поскольку для разных изображений набор цветов будет различаться, то его необходимо хранить в памяти компьютера вместе с изображением. ^
|