Python. Урок 3. Типы и модель данных

В данном уроке разберем как Python работает с переменными и определим какие типы данных можно использовать в рамках этого языка. Подробно рассмотрим модель данных Python, а также механизмы создания и изменения значения переменных.

Немного о типизации языков программирования

Если достаточно формально подходить к вопросу о типизации языка Python, то можно сказать, что он относится к языкам с неявной сильной динамической типизацией.

Неявная типизация означает, что при объявлении переменной вам не нужно указывать её тип, при явной – это делать необходимо. В качестве примера языков с явной типизацией можно привести Java, C++. Вот как будет выглядеть объявление целочисленной переменной в Java и Python.

Java:

int a = 1;

Python:

a = 1

Также языки бывают с динамической и статической типизацией. В первом случае тип переменной определяется непосредственно при выполнении программы, во втором – на этапе компиляции (о компиляции и интерпретации кратко рассказано в уроке 2). Как уже было сказано Python – это динамически типизированный язык, такие языки как С, C#, Java – статически типизированные.

Сильная типизация не позволяет производить операции в выражениях с данными различных типов, слабая – позволяет. В языках с сильной типизацией вы не можете складывать например строки и числа, нужно все приводить к одному типу. К первой группе можно отнести Python, Java, ко второй – С и С++.

За более подробным разъяснением данного вопроса советуем обратиться к статье “Ликбез по типизации в языках программирования.

Типы данных в Python

В Python типы данных можно разделить на встроенные в интерпретатор (built-in) и не встроенные, которые можно использовать при импортировании соответствующих модулей.

К основным встроенным типам относятся:

  1. None (неопределенное значение переменной)
  2. Логические переменные (Boolean Type)
  3. Числа (Numeric Type)
    1. int – целое число
    2. float – число с плавающей точкой
    3. complex – комплексное число
  4. Списки (Sequence Type)
    1. list – список
    2. tuple – кортеж
    3. range – диапазон
  5. Строки (Text Sequence Type )
    1. str
  6. Бинарные списки (Binary Sequence Types)
    1. bytes – байты
    2. bytearray – массивы байт
    3. memoryview – специальные объекты для доступа к внутренним данным объекта через protocol buffer
  7. Множества (Set Types)
    1. set – множество
    2. frozenset – неизменяемое множество
  8. Словари (Mapping Types)
    1. dict – словарь

Модель данных

Рассмотрим как создаются объекты в памяти, их устройство, процесс объявления новых переменных и работу операции присваивания.

Для того, чтобы объявить и сразу инициализировать переменную необходимо написать её имя, потом поставить знак равенства и значение, с которым эта переменная будет создана. Например строка:

b = 5

объявляет переменную b и присваивает ей значение 5.

Целочисленное значение 5 в рамках языка Python по сути своей является объектом. Объект, в данном случае – это абстракция для представления данных, данные – это числа, списки, строки и т.п. При этом, под данными следует понимать как непосредственно сами объекты, так и отношения между ними (об этом чуть позже). Каждый объект имеет три атрибута – это идентификатор, значение и тип. Идентификатор – это уникальный признак объекта, позволяющий отличать объекты друг от друга, а значение – непосредственно информация, хранящаяся в памяти, которой управляет интерпретатор.

При инициализации переменной, на уровне интерпретатора, происходит следующее:

  • создается целочисленный объект 5 (можно представить, что в этот момент создается ячейка и 5 кладется в эту ячейку);
  • данный объект имеет некоторый идентификатор, значение: 5, и тип: целое число;
  • посредством оператора “=” создается ссылка между переменной b и целочисленным объектом 5 (переменная b ссылается на объект 5).

Имя переменной не должно совпадать с ключевыми словами интерпретатора Python. Список ключевых слов можно найти здесь. Также его можно получить непосредственно в программе, для этого нужно подключить модуль keyword и воспользоваться командой keyword.kwlist.

>>> import keyword
>>> print("Python keywords: ", keyword.kwlist)

Проверить является или нет идентификатор ключевым словом можно так:

>>> keyword.iskeyword("try")
True
>>> keyword.iskeyword("b")
False

Для того, чтобы посмотреть на объект с каким идентификатором ссылается данная переменная, можно использовать функцию id().

>>> a = 4
>>> b = 5
>>> id(a)
1829984576
>>> id(b)
1829984592
>>> a = b
>>> id(a)
1829984592

Как видно из примера, идентификатор – это некоторое целочисленное значение, посредством которого уникально адресуется объект. Изначально переменная a ссылается на объект 4 с идентификатором 1829984576, переменная b – на объект с id = 1829984592. После выполнения операции присваивания a = b, переменная a стала ссылаться на тот же объект, что и b.

Python data model work

Тип переменной можно определить с помощью функции type(). Пример использования приведен ниже.

>>> a = 10
>>> b = "hello"
>>> c = (1, 2)
>>> type(a)
<class 'int'>
>>> type(b)
<class 'str'>
>>> type(c)
<class 'tuple'>

Изменяемые и неизменяемые типы данных

В Python существуют изменяемые и неизменяемые типы.

К неизменяемым (immutable) типам относятся: целые числа (int),  числа с плавающей точкой (float), комплексные числа (complex), логические переменные (bool), кортежи (tuple), строки (str) и неизменяемые множества (frozen set).

К изменяемым (mutable) типам относятся: списки (list), множества (set), словари (dict).

Как уже было сказано ранее, при создании переменной, вначале создается объект, который имеет уникальный идентификатор, тип и значение, после этого переменная может ссылаться на созданный объект.

Неизменяемость типа данных означает, что созданный объект больше не изменяется. Например, если мы объявим переменную k = 15, то будет создан объект со значением 15, типа int и идентификатором, который можно узнать с помощью функции id().

>>> k = 15
>>> id(k)
1672501744
>>> type(k)
<class 'int'>

Объект с id = 1672501744 будет иметь значение 15 и изменить его уже нельзя.

Если тип данных изменяемый, то можно менять значение объекта. Например, создадим список [1, 2], а потом заменим второй элемент на 3.

>>> a = [1, 2]
>>> id(a)
47997336
>>> a[1] = 3
>>> a
[1, 3]
>>> id(a)
47997336

Как видно, объект на который ссылается переменная a, был изменен. Это можно проиллюстрировать следующим рисунком.

Пример изменяемого объекта

В рассмотренном случае, в качестве данных списка, выступают не объекты, а отношения между объектами. Т.е. в переменной a хранятся ссылки на объекты содержащие числа 1 и 3, а не непосредственно сами эти числа.

P.S.

Если вам интересна тема анализа данных, то мы рекомендуем ознакомиться с библиотекой Pandas. На нашем сайте вы можете найти вводные уроки по этой теме. Все уроки по библиотеке Pandas собраны в книге “Pandas. Работа с данными”.
Книга: Pandas. Работа с данными

<<< Python. Урок 2. Запуск программ на Python     Python. Урок 4. Арифметические операции >>>

Python. Урок 3. Типы и модель данных: 12 комментариев

  1. Артем

    У Вас в коде
    >>> print “Python keywords: “, keyword.kwlist
    не хватает круглых скобок:
    >>> print(“Python keywords: “, keyword.kwlist)

    1. вутмук

      создаем матрицу а=((0)*10)*10 делаем а(0)(0)=1, печатаем матрицу и видим что меняется первый элемент в каждой строке(не нашел квадратных скобок на телефоне, сорян). как это объяснить? что здесь объект а что ссылка?

  2. Wlad

    >>> a = [1, 2]
    >>> id(a)
    47997336
    >>> a[1] = 3
    >>> a
    [1, 3]
    >>> id(a)
    47997336

    Немного не понял, а ссылается теперь на 3 но id одинаково, так почему же тогда это мутируемый вид данных?

    1. writer

      Мутируемый – потому, что вы меняете содержимое, а переменная как ссылалась на определенную область памяти, помеченную id=47997336, так и продолжает на нее ссылаться. С числами (int, float) это не так, можете провести эксперимент!

    1. writer

      Спасибо, Вам! Оставайтесь с нами, будет еще много интересного!

  3. Косоглазый Хирург

    “Объект с id = 1672501744 будет иметь значение 15 и изменить его уже нельзя.”
    Не совсем ясно что вы подразумеваете под невозможностью изменить обьект с данным id. Если, к примеру, присвоить переменной k = 7, то, как я понимаю, будет создан новый обьект с новым id, ссылающийся на 7, но что тогда будет с прежним обьектом с id = 1672501744? Будет ли, как в c#, активирован в определенный момент времени сборщик мусора так как на данный обьект нет ссылок или что-то другое?

  4. Мансур из Таджикистана

    Все круто и ясна я все этим коди попробовал они работал
    спасибо вам я очень рад

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *