Простые советы.: Python

Показаны сообщения с ярлыком Python. Показать все сообщения

воскресенье, 28 мая 2017 г.

Шпаргалки для программистов

Несколько сборников полезных шпаргалок:

— Подборка шпаргалок для программистов: https://tproger.ru/digest/top-cheatsheets/

— На замену гуглу: https://tproger.ru/digest/programming-useful-links/ — еще один сборник полезных для программиста ссылок.

— Большая подборка шпаргалок на сайте OverAPI: https://tproger.ru/links/overapi-com/

— Полезные команды Linux, о которых вы не знали: https://tproger.ru/articles/cool-linux-commands/

— Если вы только начинаете свое знакомство с Bash, то вот вам наша шпаргалка для начинающих: https://tproger.ru/translations/bash-cheatsheet/

понедельник, 22 мая 2017 г.

Пишем ботов

Несколько DIY-руководств:

— Пишем бота для Facebook Messenger:https://tproger.ru/translati…/making-a-python-bot-for-memes/ — руководство по созданию приложения на Python, которое будет присылать свежие мемы, шутки и мотивационные сообщения.

— «Хочу как Дуров»: пишем простой мессенджер: https://tproger.ru/translations/building-messenger/

— Создание веб-приложения для распознавания лиц за час: https://tproger.ru/transla…/face-recognition-app-in-an-hour/

— Пишем сокращатель ссылок при помощи AWS Lambda за 2 часа: https://tproger.ru/translations/aws-lambda-url-shortener/

среда, 26 апреля 2017 г.

Материалы для программистов (все темы)

Отличные бесплатные материалы для программистов. Найдется всё:

— Огромнейшая подборка, более 1500 материалов: https://tproger.ru/articles/free-programming-books/ — и, да, все бесплатно.

Полностью такую подборку осилить сложно, так что вот вам более узкие подборки в дополнение:

— Материалы по продвинутым алгоритмам и структурам данных: https://tproger.ru/digest/advanced-computer-science/

— 83 бесплатных материала по грамотному тестированию: https://tproger.ru/digest/free-software-testing-books/

— Материалы по криптографии: https://tproger.ru/digest/crypto/

— Подборка материалов для изучения машинного обучения: https://tproger.ru/digest/machine-learning-materials/

— Самая полная подборка фильмов для айтишников: https://tproger.ru/digest/films/ — не все бесплатные, но вы знаете, что делать 😉

Материалы по отдельным языкам:

— Материалы для изучения Java: https://tproger.ru/digest/java-learning-materials/
и https://tproger.ru/digest/java-learning-links/

— Материалы для изучения Python: https://tproger.ru/digest/python-materials/
и https://tproger.ru/digest/data-science-python/

— То, что должен знать любой начинающий C#-программист: https://tproger.ru/translations/csharp-basic-skills/

Блоги и каналы на YouTube:

— 12 лучших блогов: https://tproger.ru/digest/12-best-blogs-from-tproger/

— Лучшие YouTube-каналы о программировании по версии Tproger: https://tproger.ru/digest/best-itchannels-digest/

— Чем пополнить закладки: 10 блогов ведущих IT-специалистов и компаний: https://tproger.ru/digest/top-10-it-blogs/

Фундаментальные знания для всех

Серьезная литература по программированию для тех, кто хочет овладеть фундаментальными знаниями:

— 4 лучшие книги по C++: https://tproger.ru/books/cpp-books/ — бестселлеры Скотта Мейерса.

— Подборка литературы по теории программирования: https://tproger.ru/books/books-not-for-the-code-monkeys/

— 4 книги о системах контроля версий, которые дадут о них полное представление: https://tproger.ru/books/4-books-about-vcs/

— Подборка книг о компиляторах и обо всем, что с ними связано: https://tproger.ru/books/compiler-design-books/

— 9 полезных бесплатных книг по машинному обучению: https://tproger.ru/boo…/9-free-books-about-machine-learning/

суббота, 22 апреля 2017 г.

Материалы по Python

Несколько практических материалов по Python:

— 10 библиотек, о которых вы вряд ли слышали: https://tproger.ru/…/10-python-libraries-you-might-not-know/

— Создаём мозаику из случайных изображений: https://tproger.ru/translations/mosaic-from-random-images/

— 10 полезных материалов для быстрого старта ваших проектов: https://tproger.ru/digest/python-articles/

— 18 библиотек для анализа данных: https://tproger.ru/digest/python-data-library/

— Больше статей можно найти здесь: https://tproger.ru/tag/python/

вторник, 31 января 2017 г.

Регулярные выражения для новичков

Что такое регулярные выражения?

Если вам когда-нибудь приходилось работать с командной строкой, вы, вероятно, использовали маски имён файлов. Например, чтобы удалить все файлы в текущей директории, которые начинаются с буквы «d», можно написать rm d*.

Регулярные выражения представляют собой похожий, но гораздо более сильный инструмент для поиска строк, проверки их на соответствие какому-либо шаблону и другой подобной работы. Англоязычное название этого инструмента — Regular Expressions или просто RegExp. Строго говоря, регулярные выражения — специальный язык для описания шаблонов строк.

Реализация этого инструмента различается в разных языках программирования, хоть и не сильно. В данной статье мы будем ориентироваться в первую очередь на реализацию Perl Compatible Regular Expressions.

Основы синтаксиса

В первую очередь стоит заметить, что любая строка сама по себе является регулярным выражением. Так, выражению Хаха, очевидно, будет соответствовать строка «Хаха» и только она. Регулярные выражения являются регистрозависимыми, поэтому строка «хаха» (с маленькой буквы) уже не будет соответствовать выражению выше.

Однако уже здесь следует быть аккуратным — как и любой язык, регулярные выражения имеют спецсимволы, которые нужно экранировать. Вот их список: . ^ $ * + ? { } [ ] \ | ( ). Экранирование осуществляется обычным способом — добавлением \ перед спецсимволом.

Набор символов

Предположим, мы хотим найти в тексте все междометия, обозначающие смех. Просто Хаха нам не подойдёт — ведь под него не попадут «Хехе», «Хохо» и «Хихи». Да и проблему с регистром первой буквы нужно как-то решить.

Здесь нам на помощь придут наборы — вместо указания конкретного символа, мы можем записать целый список, и если в исследуемой строке на указанном месте будет стоять любой из перечисленных символов, строка будет считаться подходящей. Наборы записываются в квадратных скобках — паттерну [abcd] будет соответствовать любой из символов «a», «b», «c» или «d».

Внутри набора большая часть спецсимволов не нуждается в экранировании, однако использование \ перед ними не будет считаться ошибкой. По прежнему необходимо экранировать символы «\» и «^», и, желательно, «]» (так, [][] обозначает любой из символов «]» или «[», тогда как [[]х] — исключительно последовательность «[х]»). Необычное на первый взгляд поведение регулярок с символом «]» на самом деле определяется известными правилами, но гораздо легче просто экранировать этот символ, чем их запоминать. Кроме этого, экранировать нужно символ «-«, он используется для задания диапазонов (см. ниже).

Если сразу после [ записать символ ^, то набор приобретёт обратный смысл — подходящим будет считаться любой символ кроме указанных. Так, паттерну [^xyz] соответствует любой символ, кроме, собственно, «x», «y» или «z».

Итак, применяя данный инструмент к нашему случаю, если мы напишем [Хх][аоие]х[аоие], то каждая из строк «Хаха», «хехе», «хихи» и даже «Хохо» будут соответствовать шаблону.

Предопределённые классы символов

Для некоторых наборов, которые используются достаточно часто, существуют специальные шаблоны. Так, для описания любого пробельного символа (пробел, табуляция, перенос строки) используется \s, для цифр — \d, для символов латиницы, цифр и подчёркивания «_» — \w.

Если необходимо описать вообще любой символ, для этого используется точка — .. Если указанные классы написать с заглавной буквы (\S, \D, \W) то они поменяют свой смысл на противоположный — любой непробельный символ, любой символ, который не является цифрой, и любой символ кроме латиницы, цифр или подчёркивания соответственно.

Также с помощью регулярных выражений есть возможность проверить положение строки относительно остального текста. Выражение \b обозначает границу слова, \B — не границу слова, ^ — начало текста, а $ — конец. Так, по паттерну \bJava\b в строке «Java and JavaScript» найдутся первые 4 символа, а по паттерну \bJava\B — символы c 10-го по 13-й (в составе слова «JavaScript»).

Диапазоны

У вас может возникнуть необходимость обозначить набор, в который входят буквы, например, от «б» до «ф». Вместо того, чтобы писать [бвгдежзиклмнопрстуф] можно воспользоваться механизмом диапазонов и написать [б-ф]. Так, паттерну x[0-8A-F][0-8A-F] соответствует строка «xA6», но не соответствует «xb9» (во-первых, из-за того, что в диапазоне указаны только заглавные буквы, во-вторых, из-за того, что 9 не входит в промежуток 0-8).

Механизм диапазонов особенно актуален для русского языка, ведь для него нет конструкции, аналогичной \w. Чтобы обозначить все буквы русского алфавита, можно использовать паттерн [а-яА-ЯёЁ]. Обратите внимание, что буква «ё» не включается в общий диапазон букв, и её нужно указывать отдельно.

Квантификаторы (указание количества повторений)

Вернёмся к нашему примеру. Что, если в «смеющемся» междометии будет больше одной гласной между буквами «х», например «Хаахаааа»? Наша старая регулярка уже не сможет нам помочь. Здесь нам придётся воспользоваться квантификаторами.

Квантификатор	Число повторений	Пример	Подходящие строки
{n}	Ровно n раз	Ха{3}хаr	Хаааха
{m,n}	От m до n включительно	Ха{2,4}ха	Хаа, Хааа, Хааааха
{m,}	Не менее m	Ха{2,}ха	Хааха, Хаааха, Хааааха и т. д.
{,n}	Не более n	Ха{,3}ха	Хха, Хаха, Хааха, Хаааха

Обратите внимание, что квантификатор применяется только к символу, который стоит перед ним.

Некоторые часто используемые выражения получили в языке регулярных выражений специальные обозначения:

Квантификатор	Аналог	Значение
?	{0,1}	Ноль или одно вхождение
*	{0,}	Ноль или более
+	{1,}	Одно или более

Таким образом, с помощью квантификаторов мы можем улучшить наш шаблон для междометий до [Хх][аоеи]+х[аоеи]*, и он сможет распознавать строки «Хааха», «хееееех» и «Хихии».

Ленивая квантификация

Предположим, перед нами стоит задача — найти все HTML-теги в строке

<p><b>Tproger</b> — мой <i>любимый</i> сайт о программировании!</p>

Очевидное решение <.*> здесь не сработает — оно найдёт всю строку целиком, т.к. она начинается с тега абзаца и им же заканчивается. То есть содержимым тега будет считаться строка

p><b>Tproger</b> — мой <i>любимый</i> сайт о программировании!</p

Это происходит из-за того, что по умолчанию квантификатор работают по т.н. жадному алгоритму — старается вернуть как можно более длинную строку, соответствующую условию. Решить проблему можно двумя способами. Первый — использовать выражение <[^>]*>, которое запретит считать содержимым тега правую угловую скобку. Второй — объявить квантификатор не жадным, а ленивым. Делается это с помощью добавления справа к квантификатору символа ?. Т.е. для поиска всех тегов выражение обратится в <.*?>.

Ревнивая квантификация

Иногда для увеличения скорости поиска (особенно в тех случаях, когда строка не соответствует регулярному выражению) можно использовать запрет алгоритму возвращаться к предыдущим шагам поиска для того, чтобы найти возможные соответствия для оставшейся части регулярного выражения. Это называется ревнивой квантификацией. Квантификатор делается ревнивым с помощью добавления к нему справа символа +. Ещё одно применение ревнивой квантификации — исключение нежелательных совпадений. Так, паттерну ab*+a в строке «ababa» будут соответствовать только первые три символа, но не символы с третьего по пятый, т.к. символ «a», который стоит на третьей позиции, уже был использован для первого результата.

Скобочные группы

Для нашего шаблона «смеющегося» междометия осталась самая малость — учесть, что буква «х» может встречаться более одного раза, например, «Хахахахааахахооо», а может и вовсе заканчиваться на букве «х». Вероятно, здесь нужно применить квантификатор для группы [аиое]+х, но если мы просто напишем [аиое]х+, то квантификатор + будет относиться только к символу «х», а не ко всему выражению. Чтобы это исправить, выражение нужно взять в круглые скобки: ([аиое]х)+.

Таким образом, наше выражение превращается в [Хх]([аиое]х?)+ — сначала идёт заглавная или строчная «х», а потом произвольное ненулевое количество гласных, которые (возможно, но не обязательно) перемежаются одиночными строчными «х». Однако это выражение решает проблему лишь частично — под это выражение попадут и такие строки, как, например, «хихахех» — кто-то может быть так и смеётся, но допущение весьма сомнительное. Очевидно, мы можем использовать набор из всех гласных лишь единожды, а потом должны как-то опираться на результат первого поиска. Но как?…

Запоминание результата поиска по группе (обратная связь)

Оказывается, результат поиска по скобочной группе записывается в отдельную ячейку памяти, доступ к которой доступен для использования в последующих частях регулярного выражения. Возвращаясь к задачи с поиском HTML-тегов на странице, нам может понадобиться не только найти теги, но и узнать их название. В этом нам может помочь регулярное выражение <(.*?)>.

<p><b>Tproger</b> — мой <i>любимый</i> сайт о программировании!</p>

Результат поиска по всем регулярному выражению: «», «», «», «», «», «».

Результат поиска по первой группе: «p», «b», «/b», «i», «/i», «/i», «/p».

На результат поиска по группе можно ссылаться с помощью выражения \n, где n — цифра от 1 до 9. Например выражению (\w)(\w)\1\2 соответствуют строки «aaaa», «abab», но не соответствует «aabb».

Если выражение берётся в скобки только для применения к ней квантификатора (не планируется запоминать результат поиска по этой группе), то сразу первой скобки стоит добавить ?:, например (?:[abcd]+\w).

С использованием этого механизма мы можем переписать наше выражение к виду [Хх]([аоие])х?(?:\1х?)*.

Перечисление

Чтобы проверить, удовлетворяет ли строка хотя бы одному из шаблонов, можно воспользоваться аналогом булевого оператора OR, который записывается с помощью символа |. Так, под шаблон Анна|Одиночество попадают строки «Анна» и «Одиночество» соответственно. Особенно удобно использовать перечисления внутри скобочных групп. Так, например (?:a|b|c|d) полностью эквивалентно [abcd] (в данном случае второй вариант предпочтительнее в силу производительности и читаемости).

С помощью этого оператора мы сможем добавить к нашему регулярному выражению для поиска междометий возможность распознавать смех вида «Ахахаах» — единственной усмешке, которая начинается с гласной: [Хх]([аоие])х?(?:\1х?)*|[Аа]х?(?:ах?)+

Полезные сервисы

Потренироваться и / или проверить своё регулярное выражение на каком-либо тексте без написания кода можно с помощью таких сервисов, как RegExr, Regexpal или Regex101. Последний, вдобавок, приводит краткие пояснения к тому, как регулярка работает.

Разобраться, как работает регулярное выражение, которое попало к вам в руки, можно с помощью сервиса Regexper — он умеет строить понятные диаграмы по регулярному выражению.

RegExp Builder — визуальный конструктор функций JavaScript для работы с регулярными выражениями. Больше инструментов можно найти в нашей подборке.

Задания для закрепления

Найдите время

Время имеет формат часы:минуты. И часы, и минуты состоят из двух цифр, пример: 09:00. Напишите регулярное выражение для поиска времени в строке: «Завтрак в 09:00». Учтите, что «37:98» — некорректное время.

(2[0-3]|[0-1]\d):[0-5]\d

Java[^script]

Найдет ли регулярка Java[^script] что-нибудь в строке Java? А в строке JavaScript?

Цвет

Напишите регулярное выражение для поиска HTML-цвета, заданного как #ABCDEF, то есть # и содержит затем 6 шестнадцатеричных символов.

Итак, нужно написать выражение для описания цвета, который начинается с «#», за которым следуют 6 шестнадцатеричных символов. Шестнадцатеричный символ можно описать с помощью [0-9a-fA-F]. Для его шестикратного повторения мы будем использовать квантификатор {6}.

 
#[0-9a-fA-F]{6}

Разобрать арифметическое выражение

Арифметическое выражение состоит из двух чисел и операции между ними, например:

1 + 2
1.2 * 3.4
-3 / -6
-2 — 2
Список операций: «+», «-», «*» и «/».

Также могут присутствовать пробелы вокруг оператора и чисел.

Напишите регулярное выражение, которое найдёт как всё арифметическое действие, так и (через группы) два операнда.

Регулярное выражение для числа, возможно, дробного и отрицательного: -?\d+(\.\d+)?.

Оператор – это [+*/\-]. Заметим, что дефис мы экранируем. Нам нужно число, затем оператор, затем число, и необязательные пробелы между ними. Чтобы получить результат в требуемом формате, добавим ?: к группам, поиск по которым нам не интересен (отдельно дробные части), а операнды наоборот заключим в скобки. В итоге:

 
(-?\d+(?:\.\d+)?)\s*([-+*\/])\s*(-?\d+(?:\.\d+)?)

Кроссворды из регулярных выражений

Интересное и полезное времяпрепровождение! Найти такие кроссворды можно в подборке.

Типичный программист

понедельник, 30 января 2017 г.

Python советы для начинающих

Hесколько интересных материалов для новичков, посвященных Python:

— Модуль os (Как с помощью Python удалить файл или папку):https://pythonworld.ru/moduli/modul-os.html
— Отправляем email уведомления с помощью Python: https://vk.cc/65kNF5
— 10 полезных материалов по Python для быстрого старта ваших проектов:https://tproger.ru/digest/python-articles
— Работаем с файлами при помощи Python: https://vk.cc/65kTE3
— Реализуем простой веб-сервер на Python и Flask: https://vk.cc/65kZq1
Питон https://tproger.ru/tag/python/

Еще больше материалов по Python можно найти в соответствующей рубрике сайте: https://tproger.ru/tag/python/

Типичный программист

Хотите освоить самые современные методы написания React приложений? Надоели простые проекты? Нужны курсы, книги, руководства, индивидуальные занятия по React и не только? Хотите стать разработчиком полного цикла, освоить стек MERN, или вы только начинаете свой путь в программировании, и не знаете с чего начать, то пишите через форму связи, подписывайтесь на мой канал в Телеге, вступайте в группу на Facebook.Пишите мне - kolesnikovy70 почта gmail.com

Страницы

Translate

Поиск по этому блогу

воскресенье, 28 мая 2017 г.

Шпаргалки для программистов

понедельник, 22 мая 2017 г.

Пишем ботов

среда, 26 апреля 2017 г.

Материалы для программистов (все темы)

Полностью такую подборку осилить сложно, так что вот вам более узкие подборки в дополнение:

Материалы по отдельным языкам:

Блоги и каналы на YouTube:

суббота, 22 апреля 2017 г.

Материалы по Python

вторник, 31 января 2017 г.

Регулярные выражения для новичков

Что такое регулярные выражения?

Основы синтаксиса

Набор символов

Предопределённые классы символов

Диапазоны

Квантификаторы (указание количества повторений)

Ленивая квантификация

Ревнивая квантификация

Скобочные группы

Запоминание результата поиска по группе (обратная связь)

Перечисление

Полезные сервисы

Задания для закрепления

Найдите время

Java[^script]

Цвет

Разобрать арифметическое выражение

Кроссворды из регулярных выражений

понедельник, 30 января 2017 г.

Python советы для начинающих

Hесколько интересных материалов для новичков, посвященных Python:

Ярлыки

Форма для связи

Страницы

Translate

Поиск по этому блогу

воскресенье, 28 мая 2017 г.

понедельник, 22 мая 2017 г.

среда, 26 апреля 2017 г.

Полностью такую подборку осилить сложно, так что вот вам более узкие подборки в дополнение:

Материалы по отдельным языкам:

Блоги и каналы на YouTube:

суббота, 22 апреля 2017 г.

вторник, 31 января 2017 г.

Что такое регулярные выражения?

Основы синтаксиса

Набор символов

Предопределённые классы символов

Диапазоны

Квантификаторы (указание количества повторений)

Ленивая квантификация

Ревнивая квантификация

Скобочные группы

Запоминание результата поиска по группе (обратная связь)

Перечисление

Полезные сервисы

Задания для закрепления

Найдите время

Java[^script]

Цвет

Разобрать арифметическое выражение

Кроссворды из регулярных выражений

понедельник, 30 января 2017 г.

Hесколько интересных материалов для новичков, посвященных Python:

Ярлыки

Форма для связи

воскресенье, 28 мая 2017 г.

понедельник, 22 мая 2017 г.

среда, 26 апреля 2017 г.

суббота, 22 апреля 2017 г.

вторник, 31 января 2017 г.

понедельник, 30 января 2017 г.