Измерение информации. Алфавитный подход к измерению информации Учитель информатики МБОУ «СОШ №32» ЭМР Саратовской области, Токмакова Людмила Викторовна
информация, измерение информации;алфавитный подход к измерению информации;алфавит, мощность алфавита;информационный вес символа;информационный объем текста;достаточный алфавит;единицы измерения информации;скорость передачи информации.
После изучения курса вы должны знать:что такое информация?в каком случае применяется алфавитный подход при решении задач на измерение информации? какая формула позволяет решать задачи на измерение количества информации, при алфавитном подходе?что такое достаточный алфавит?как определяется единица измерения информации – бит при алфавитном подходе; что такое байт, килобайт, мегабайт, гигабайт;что такое скорость передачи информации.и уметь: приводить примеры сообщений, несущих 1 бит информации; измерять информационный объем текста; пересчитывать количество информации в различных единицах;определять скорость передачи информации.
Слово «информация» происходит от лат. informatio, что в переводе обозначает сведение, разъяснение, ознакомление. Понятие информации рассматривалось ещё античными философами.До начала промышленной революции, определение сути информации оставалось прерогативой (привилегией) преимущественно философов. В XX веке вопросами теории информации стали заниматься кибернетики и информатики.
Вопрос: «Как измерить информацию?» очень непростой. Ответ на него зависит от того, что понимать под информацией. Но поскольку определять информацию можно по-разному, то и способы измерения тоже могут быть разными.
Алфавитным подходом называется способ измерения информации, который не связывает количество информации с содержанием сообщения.При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.Применение алфавитного подхода удобно прежде всего при использовании технических средств работы с информацией. В этом случае теряют смысл понятия «новые — старые», «понятные — непонятные» сведения. Алфавитный подход является объективным, т.е. он не зависит от субъекта (человека), воспринимающего текст.Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык.
Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами.Полное количество символов алфавита принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из заглавных русских букв и отмеченных дополнительных символов равна 54 (буквы, цифры, знаки препинания, пробел).АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЪЭЮЯ0123456789().,!?«»:-;(пробел)
Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), тоN=2iгде i – информационный вес одного символа в используемом алфавите,N – мощность алфавита.Если весь текст состоит из К символов, то при алфавитном подходе размер содержащейся в нем информации равен: I = К i (информационный объем сообщения = количество символов в сообщении * на вес одного символа)
Представьте себе, что текст к вам поступает последовательно, по одному знаку, словно бумажная ленточка, выползающая из телеграфного аппарата. Предположим, что каждый появляющийся на ленте символ с одинаковой вероятностью может быть любым символом алфавита. В каждой очередной позиции текста может появиться любой из N символов. Тогда, согласно известной нам формуле каждый такой символ несет i бит информации, которое можно определить из решения уравнения: В какую степень мы должны возвести 2, чтобы получить 54? 25=32, а 26=64. Мы можем подсчитать или посмотреть по таблице степеней двойки и получаем: i = 5.755 бит.Вот сколько информации несет один символ в русском тексте!
Для того, чтобы найти количество информации во всем тексте, нужно посчитать число символов в нем и умножить на «вес» одного символа - i.Возьмём с книжной полки какую-нибудь книгу и посчитаем количество информации на одной её странице. Пусть страница содержит 50 строк. В каждой строке — 60 символов. Значит, на странице умещается 50x60=3000 знаков. Тогда объем информации будет равен: 5,755 х 3000 = 17265 бит.Следовательно, при алфавитном подходе к измерению информации количество информации от содержания не зависит. Количество информации зависит от объёма текста (то есть от числа знаков в тексте) и от мощности алфавита.
Отсюда следует, например, что нельзя сравнивать информационные объёмы текстов, написанных на разных языках, только по объёму. У них отличаются информационные веса одного символа так как мощности алфавитов разных языков – различные.Но если книги написаны на одном языке, то понятно, что в толстой книге информации больше, чем в тонкой. При этом содержательная сторона книги в расчёт не берётся.Сформулируем правило, как измерить информацию, используя для этого алфавитный подход.Количество информации, содержащееся в символьном сообщении, равно К х i, где К – число символов в тексте сообщения а i – информационный вес символа, который находится из уравнения 2i = N, где N – мощность используемого алфавита.
Оформление решения задачи №1 ОБРАТИТЕ ВНИМАНИЕ!
6.Формула определения информационного веса символа двоичного алфавита А что если алфавит состоит только из двух символов 0 и 1? При использовании двоичной системы (алфавит состоит из двух знаков: 0 и 1) каждый двоичный знак несет 1 бит информации, так как в этом случае: N = 2; N = 2i ; 2= 2i ; i = 1!Интересно, что сама единица измерения информации «бит» получила свое название от английского сочетания «binary digit» - «двоичная цифра».
Удобнее всего измерять информацию, когда размер алфавита N равен целой степени двойки. Например, если N=16, то каждый символ несет 4 бита информации потому, что А если N=32, то один символ «весит» 5 бит. Ограничения на максимальный размер алфавита теоретически не существует. Однако есть алфавит, который можно назвать достаточным. С ним мы встретимся при работе с компьютером. Это алфавит мощностью 256 символов.
В алфавит такого размера можно поместить все практически необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания.Поскольку то один символ этого алфавита «весит» 8 бит. Причем 8 бит информации — это настолько характерная величина, что ей даже присвоили свое название — байт.1 байт = 8 бит
Достаточный алфавит. Количество информации в тексте. Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов. В этом случае легко подсчитать объем информации в тексте. Задача 2. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.Пусть небольшая книжка, сделанная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов. Значит страница содержит 40x60=2400 байт информации. Объем всей информации в книге: 2400 х 150 = 360 000 байт.
Оформление решения задачи №2
8. Единицы измерения информации
8. Единицы измерения информации Сколько Кб составляет сообщение, содержащее 8192 бит?Решение:1 байт = 8 бит;1 Кбайт = 1024 байта;8192 : 8 = 1024 байт = 1 Кб.Ответ: 1 Кб.
ОБРАТИТЕ ВНИМАНИЕ! Оформление решения задачи №3
8. Единицы измерения информации Сколько мегабайт информации содержит сообщение объемом 223 бит? В ответе укажите одно число.Решение.223 бит = 210*210 *23 бит = 210*210 байт = 210 Кб = 1 МбОтвет: 1 Мб.
ОБРАТИТЕ ВНИМАНИЕ! Оформление решения задачи №4
Будем называть скоростью передачи информации количество информации, выраженное в битах или байтах, переданное в единицу времени. Скорость передачи информации может измеряется в битах в секунду - б/с, Килобитах в секунду - Кб/с или Мегабитах в секунду - Мб/с. А также: в байтах в секунду - Б/с, Килобайтах в секунду - КБ/с и т.д., соответственно.(Замечу в скобках - многие мало знакомые с информатикой люди часто путают б/с и Б/с (биты в секунду с байтами в секунду), а они различаются в 8 раз!)
Другое, очень схожее понятие, которое часто путают со скоростью передачи информации - пропускная способность канала. Измеряется она в тех же единица, что и скорость, но если скорость передачи информации показывает - как быстро передается информация от источника к получателю безотносительно к тому как и по каким каналам эта информация передается, то пропускная способность канала показывает - как много информации можно передать по конкретному каналу передачи данных в единицу времени. Т.е. пропускная способность - это максимально возможная скорость передачи данных для конкретного канала.
При решении данных задачах необходимо найти либо количество информации переданное через интернет соединение, либо время этой самой передачи, либо скорость передачи. Во всех случая надо помнить, что есть связь между скоростью и количеством информации переданной в промежутке времени.
Задача5.Скорость передачи данных через ADSL-соединение равна 512000 бит/c. Передача файла через это соединение заняла 1 минуту. Определить размер файла в килобайтах. Объем переданной информации Q вычисляется по формуле Q=q*t , где q – пропускная способность канала (в битах в секунду или подобных единицах), а t – времяпередачи.Решение:Выделим в заданных больших числах степени двойки; переведем время в секунды (чтобы «согласовать» единицы измерения), а скорость передачи – в Кбайты/с, поскольку ответ нужно получить в Кбайтах: t=1мин=60с=4*15с=22*15сq=512000бит/c=512*1000бит/с=29 *125*8бит/с=29*53*23бит/с==212*53бит/с=29*53байт/с=53/2Кбайт/с
9. Скорость передачи информации.
ОБРАТИТЕ ВНИМАНИЕ! Оформление решения задачи №5
Закрепление: Задача 6 Информационное сообщение объемом 0,125 Кб содержит 256 символов. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?Решение:Мощность алфавита (N) и информационный вес одного символа (i), связаны между собой формулой: Объем информационного сообщения (I) и информационный вес одного символа (i), связаны между собой формулой:В битах объем сообщения составляет:I=0,125 Кб * 1024 = 128 байт * 8 = 1024 бит.Сообщение содержит 256 символов, следовательно, i = 1024 : 256 = 4 бит (вес одного символа). Ответ: алфавит содержит 16 символов.
Задача 7.Сколько школьных учебников емкостью 350 Кбайт можно разместить на трехдюймовой дискете, если объем трехдюймовой дискеты – 1,44 МбайтРешение:1Мбайт=1024Кбайт1,44Мбайт = 1,44*1024 = 1474,56 Кбайт1474,56 Кбайт / 350 Кбайт = 4 учебника
Задача 8.Оцените информационный объем следующего предложения:Тяжело в ученье – легко в бою!Так как каждый символ кодируется одним байтом, нам только нужно подсчитать количество символов, но при этом не забываем считать знаки препинания и пробелы. Всего получаем 30 символов. А это означает, что информационный объем данного сообщения составляет 30 байтов или 30 * 8 = 240 битов.
Задача 9.Результатом одного измерения является целое число от 0 до 100 процентов, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений. РЕШЕНИЕ:От 0 до 100 - это 101 разное значение. 64<101<128, значит для кодирования надо 7 бит, 128=27. 7*80=560 бит. 560 бит = 560/8 = 70 байт.ОТВЕТ: 70 байт
Методические рекомендации по решению задач:Если мощность алфавита неизвестна, то единицы измерения информации должны быть переведены в биты, только при использовании достаточного алфавита, единицы измерения – байты. В условиях задач по обсуждаемой теме связываются между собой следующие величины: мощность символьного алфавита — N; информационный вес символа — i; число символов в тексте (объем текста) — К; количество информации, заключенное в тексте (информационный объем текста) — I. Кроме того, при решении задач требуется знать связь между различными единицами информации: бит, байт, Кбайт, Мбайт.
На этом теоретическая часть закончена. Желаю успеха в освоении данного курса.
ИСПОЛЬЗУЕМЫЕ ИСТОЧНИКИ ДЛЯ ПОДГОТОВКИ ПРЕЗЕНТАЦИИ: http://egeinf.gym5cheb.ru/p79aa1.html http://intpage.ru/%D0%B7%D0%B0%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5-15-%D0%B3%D0%B8%D0%B02013/http://paulnn.ru/Speed.htmlhttp://do.gendocs.ru/docs/index-378410.htmlhttp://ruban.wmsite.ru/uchebnik/praktika/edinicy-izmerenija-kolichestva-informacii/http://www.trinity.se-ua.net/page12/2/1/http://pedsovet.su/load/321-5-2 - Шаблоны презентаций PowerPoint раздела "Оформление презентаций
ИСПОЛЬЗУЕМЫЕ ИСТОЧНИКИ ДЛЯ ПОДГОТОВКИ ПРЕЗЕНТАЦИИ:Литература:1. Лапчик М.П. и др. Методика преподавания информатики: Учеб. пособие для студ. пед. вузов.-- М.: Издательский центр «Академия», 2001;2. Семакин И.Г., Залогова Л. А., Русаков С.В., Шестакова Л.В. Информатика и ИКТ: учебник для 8 класса. .-- М.: БИНОМ. Лаборатория знаний, 2013;3. Угринович Н.Д. Информатика и ИКТ. Базовый курс: Учебник для 8 класса.-- М.: БИНОМ. Лаборатория знаний, 2010.