Генераторы и итераторы представляют собой инструменты, которые, как правило, используются для поточной обработки данных. В уроке рассмотрим концепцию итераторов в Python, научимся создавать свои итераторы и разберемся как работать с генераторами.
Итераторы в языке Python
Во многих современных языках программирования используют такие сущности как итераторы. Основное их назначение – это упрощение навигации по элементам объекта, который, как правило, представляет собой некоторую коллекцию (список, словарь и т.п.). Язык Python, в этом случае, не исключение и в нем тоже есть поддержка итераторов. Итератор представляет собой объект перечислитель, который для данного объекта выдает следующий элемент, либо бросает исключение, если элементов больше нет.
Основное место использования итераторов – это цикл for. Если вы перебираете элементы в некотором списке или символы в строке с помощью цикла for, то ,фактически, это означает, что при каждой итерации цикла происходит обращение к итератору, содержащемуся в строке/списке, с требованием выдать следующий элемент, если элементов в объекте больше нет, то итератор генерирует исключение, обрабатываемое в рамках цикла for незаметно для пользователя.
Приведем несколько примеров, которые помогут лучше понять эту концепцию. Для начала выведем элементы произвольного списка на экран.
>>> num_list = [1, 2, 3, 4, 5] >>> for i in num_list: print(i) 1 2 3 4 5
Как уже было сказано, объекты, элементы которых можно перебирать в цикле for, содержат в себе объект итератор, для того, чтобы его получить необходимо использовать функцию iter(), а для извлечения следующего элемента из итератора – функцию next().
>>> itr = iter(num_list) >>> print(next(itr)) 1 >>> print(next(itr)) 2 >>> print(next(itr)) 3 >>> print(next(itr)) 4 >>> print(next(itr)) 5 >>> print(next(itr)) Traceback (most recent call last): File "<pyshell#12>", line 1, in <module> print(next(itr)) StopIteration
Как видно из приведенного выше примера вызов функции next(itr) каждый раз возвращает следующий элемент из списка, а когда эти элементы заканчиваются, генерируется исключение StopIteration.
Создание собственных итераторов
Если нужно обойти элементы внутри объекта вашего собственного класса, необходимо построить свой итератор. Создадим класс, объект которого будет итератором, выдающим определенное количество единиц, которое пользователь задает при создании объекта. Такой класс будет содержать конструктор, принимающий на вход количество единиц и метод __next__(), без него экземпляры данного класса не будут итераторами.
class SimpleIterator: def __init__(self, limit): self.limit = limit self.counter = 0 def __next__(self): if self.counter < self.limit: self.counter += 1 return 1 else: raise StopIteration s_iter1 = SimpleIterator(3) print(next(s_iter1)) print(next(s_iter1)) print(next(s_iter1)) print(next(s_iter1))
В нашем примере при четвертом вызове функции next() будет выброшено исключение StopIteration. Если мы хотим, чтобы с данным объектом можно было работать в цикле for, то в класс SimpleIterator нужно добавить метод __iter__(), который возвращает итератор, в данном случае этот метод должен возвращать self.
class SimpleIterator: def __iter__(self): return self def __init__(self, limit): self.limit = limit self.counter = 0 def __next__(self): if self.counter < self.limit: self.counter += 1 return 1 else: raise StopIteration s_iter2 = SimpleIterator(5) for i in s_iter2: print(i)
Генераторы
Генераторы позволяют значительно упростить работу по конструированию итераторов. В предыдущих примерах, для построения итератора и работы с ним, мы создавали отдельный класс. Генератор – это функция, которая будучи вызванной в функции next() возвращает следующий объект согласно алгоритму ее работы. Вместо ключевого слова return в генераторе используется yield. Проще всего работу генератор посмотреть на примере. Напишем функцию, которая генерирует необходимое нам количество единиц.
def simple_generator(val): while val > 0: val -= 1 yield 1 gen_iter = simple_generator(5) print(next(gen_iter)) print(next(gen_iter)) print(next(gen_iter)) print(next(gen_iter)) print(next(gen_iter)) print(next(gen_iter))
Данная функция будет работать точно также, как класс SimpleIterator из предыдущего примера.
Ключевым моментом для понимания работы генераторов является то, при вызове yield функция не прекращает свою работу, а “замораживается” до очередной итерации, запускаемой функцией next(). Если вы в своем генераторе, где-то используете ключевое слово return, то дойдя до этого места будет выброшено исключение StopIteration, а если после ключевого слова return поместить какую-либо информацию, то она будет добавлена к описанию StopIteration.
P.S.
Если вам интересна тема анализа данных, то мы рекомендуем ознакомиться с библиотекой Pandas. На нашем сайте вы можете найти вводные уроки по этой теме. Все уроки по библиотеке Pandas собраны в книге “Pandas. Работа с данными”.
<<< Python. Урок 14. Классы и объекты Python. Урок 16. Установка пакетов в Python>>>
У вас ошибка в коде: где описывается первый SimpleIterator, метод __next__ должен возвращать self.counter вместо 1
Спасибо за внимательность, но там на самом деле по замыслу и должна стоять единица))). Это пример наипростейшего итератора, он возвращает единицу self.limit раз. Но и ваш вариант тоже верен!
а я сам поставил self.counter, так реально симпатичней
Генератор
def simple_generator(val):
while val > 0:
val -= 1
yield 1
Здесь после yield разве не val должно быть написано?
нет, смысл не в этом
нет, смысл не в этом
Спасибо за статью
Огромнейшее спасибо за статью. Наконец-то удалось понять на базовом уровне что такое итераторы и генераторы. Очень доходчиво и понятно