Перейти до основного вмісту

Python xrange і OverflowError

sic! Дана проблема присутня в Python версій 2.х. Тим, їто працює на Python версій 3.х можна далі не читати.

Простий приклад

Уявіть собі, буває і таке. Залишилось вияснити, чому. Давайте глянемо на приклад коду, який призводить до такої помилки. Приклад досить простий:

for i in xrange(100000000000):
    print i

Приводить цей приклад до наступної помилки:

OverflowError: long int too large to convert to int

Поекспериментуємо

Добре, не хоче Python так, спробуємо по-іншому - замінити xrange на range:

for i in range(100000000000):

В результаті отримаємо ще одну цікаву (як і варто було очікувати) помилку:

OverflowError: range() result has too many items

Не хоче, падлюка, він створювати такий довгий список. Виходячи з наявних помилок, ми дізнаємось декілька цікавих (для когось, може і нецікавих) фактів про Python:
  1. Максимальна довжина списку в Python = sys.maxint, тобто - 2147483647.
  2. xrange для створення ітератора приймає числа <= sys.maxint.
  3. Якщо ви подумали, що зможете створити список довжиною sys.maxint - ви помилились. Я, наприклад, отримав ще одну досить лаконічну помилку:
MemoryError

Ну не влазить він в память, хоть ти трісни.

Продовжуємо шукати

Перша думка, звичайно, - баг. Дивимось, шукаємо, знаходимо. А за посиланням ми знаходимо баг, який добра людина запостила в багтрекер Python. І знову ж - облом. Мудрий розробник пояснює, що, недобре такі довгі ітерації робити, бо це неоптимально і ніфіга не швидко, і взагалі це не баг, а фіча, і не будемо ми його фіксити.

Очевидне рішення

Ну, рішення справді очевидне: звернемось до старого доброго циклу while, при цьому отримавши потрібний результат (варто зазначити, що працюючий набагато повільніше, ніж xrange):

number = sys.maxint + 10000
while number > 0:
number -= 1

При цьому інтерпретатор довго буде думати, але, хоча б, отримали працюючий код.

Коментарі

  1. Да здравствует Python 3 с бесконечно длинным int :)

    ВідповістиВидалити
  2. Очень ценное замечание, добавлю пометку в пост, как-то вылетело из головы ))

    ВідповістиВидалити

Дописати коментар

Популярні дописи з цього блогу

Регулярні вирази в Python: вивчення та оптимізація

Writing a regular expression is more than a skill -- it's an art. Jeffrey Friedl Що це таке? Рано чи піздно майже кожному програмісту в своєму житті доводиться стикатись з регулярними виразами. Термін "Регулярні вирази" є перекладом з англійської словосполучення "Regular expressions" і не є зовсім точним, а для тих, хто перший раз почув цей термін, мабуть, навіть спантеличуючим (я, наприклад, коли вперше почув, ніяк не міг собі второпати по назві, хоча б приблизно, що це, і для чого використовується). Літературний і більш осмислений переклад звучав би, мабуть, як "шаблонні вирази". Але назва вже прижилась, а скажете "шаблонні вирази" - вас просто не зрозуміють :). Звідси: Регулярний вираз -  це рядок, що задає шаблон пошуку під-рядків в рядку. Регулярні вирази використовуються для аналізу текстів на предмет відповідності текстової інформації деякому шаблону. Наприклад , шаблон, що задає слово, яке містить букву "к". Де застосовують...

Python: як програмно перемкнути розкладку клавіатури в Windows

Дослідивши дане питання, я побачив, що Python не має засобів "з коробки" для вирішення цієї задачі. Відвоідно, задача повинна вирішуватись для каждої ОС своїм шляхом. Дане рішення було знайдено мною для ОС Windows XP +. Панацея - Win API Для того, щоб виконати завдання необхідно встановити додатково бібліотеку pywin32 , яка надає доступ до функцій Windows API з Python. З цієї бібліотеки нам знадобиться модуль win32api . >>> import win32api Дослідивши його вміст, можна побачити, що для роботы з розкладкою клавіатури є декілька функцій і одне системне повідомлення Windows - WM_INPUTLANGCHANGE : GetKeyboardLayout GetKeyboardLayoutList LoadKeyboardLayout В даному випадку для нас важлива саме остання функція - LoadKeyboardLayout . Дана функція завантажує нову розкладку (якщо вона ще не завантажена) і виконує після цього ще якісь дії; приймає в якості аргументів два: рядок з ідентифікатором розкладки. дію. Більш детально про їхні можливі значення можна почитати в MSDN . О...

Python: PEP-8 чи не PEP-8

Пост - не технічний, кому не цікаво - можете далі не читати... PEP-8, хоча й фактично є пропозицією по розширенню Python під номером 8, серед Python програмістів уже став терміном, що позначає правила стилю оформлення коду. Ні, я не збираюсь зараз описувати його тут - про нього можна почитати в першоджерелі . Питання в тому, слідувати цьому стандарту, чи не слідувати? Ітак, стандарт це в більшості випадків добре, оскільки вносить порядок. Наприклад, стандарт USB 2.0 - просто прекрасний стандарт, уявіть собі, якби флешки були не USB, а кожна мала б свій вихід :)... Жахливо, так, були б у нас USB-порти як card-reader'и - 62 в 1.. Реально 62 в 1 Інша справа з PEP-8. Тут все по іншому, адже програма не змінює свою поведінку, якщо ми будемр робити відступ не в 4 пробіла, а 2 (добре, що більшість, все-таки, робить 4), або будемо ставити пробіл перед другою дужкою, чи не будемо і т.д..  Отже, кожен програміст може редагувати свій код як йому хочеться. Мені, наприклад, подобається...