GITVERSENEWS Telegram 738
С Днем программиста, сообщество! 🚀

Друзья, сегодня мы празднуем наш 256-й байт в году – день, когда мы чтим силу 2^8, бесконечные циклы, отладку до утра и радость от работающего кода. Немного пожеланий: пусть ваш код всегда компилируется с первого раза, баги превращаются в фичи, а дедлайны не крадут ваш сон! И, конечно, больше звезд

Отметить предлагаем по-программистски: с интересной задачкой на regex 🎉Поехали!

Представьте: вы парсите текст в поисках упоминаний «256-го» дня. Но текст хитрый — дизайнеры подкинули типографику с разными дефисами, тире и даже без них. Код вроде работает, но... пропускает кучу вариантов🐱

Вот «поломанный» сниппет на Python:

import re

text = (
"Сегодня 256-й день! Ура!\n"
"А у дизайнера типографика: 256-й день (NBSP-hyphen), 256–й (en dash), 256й без дефиса.\n"
"Ещё встретилось: 256–й, 256—й и даже 256-й в заголовке."
)

# хотим поймать: 256-й / 256й / 256-й (все «дефисы»)
found = re.findall(r"\b256-?й\b", text, flags=re.IGNORECASE)
print(found) # ожидание: ['256-й', '256-й', '256–й', '256й', '256—й', ...]


Запустите у себя — и увидите, что regex ловит не все. Почему? 🤔

А теперь вопросы:

Почему часть упоминаний не ловится, хотя визуально «дефис» есть?

Чем заменить -? в шаблоне одной правкой, чтобы покрыть всю типографику без пост-обработки, циклов или нормализации текста? (должно быть коротко и элегантно 💅)

Пишите свои идеи и догадки в комментариях ниже ⬇️

Лучшие решения отметим, а позже закинем правильный вариант от нас 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
21🔥96🤩2🥰1



tgoop.com/gitversenews/738
Create:
Last Update:

С Днем программиста, сообщество! 🚀

Друзья, сегодня мы празднуем наш 256-й байт в году – день, когда мы чтим силу 2^8, бесконечные циклы, отладку до утра и радость от работающего кода. Немного пожеланий: пусть ваш код всегда компилируется с первого раза, баги превращаются в фичи, а дедлайны не крадут ваш сон! И, конечно, больше звезд

Отметить предлагаем по-программистски: с интересной задачкой на regex 🎉Поехали!

Представьте: вы парсите текст в поисках упоминаний «256-го» дня. Но текст хитрый — дизайнеры подкинули типографику с разными дефисами, тире и даже без них. Код вроде работает, но... пропускает кучу вариантов🐱

Вот «поломанный» сниппет на Python:

import re

text = (
"Сегодня 256-й день! Ура!\n"
"А у дизайнера типографика: 256-й день (NBSP-hyphen), 256–й (en dash), 256й без дефиса.\n"
"Ещё встретилось: 256–й, 256—й и даже 256-й в заголовке."
)

# хотим поймать: 256-й / 256й / 256-й (все «дефисы»)
found = re.findall(r"\b256-?й\b", text, flags=re.IGNORECASE)
print(found) # ожидание: ['256-й', '256-й', '256–й', '256й', '256—й', ...]


Запустите у себя — и увидите, что regex ловит не все. Почему? 🤔

А теперь вопросы:

Почему часть упоминаний не ловится, хотя визуально «дефис» есть?

Чем заменить -? в шаблоне одной правкой, чтобы покрыть всю типографику без пост-обработки, циклов или нормализации текста? (должно быть коротко и элегантно 💅)

Пишите свои идеи и догадки в комментариях ниже ⬇️

Лучшие решения отметим, а позже закинем правильный вариант от нас 😉

BY GitVerse News




Share with your friend now:
tgoop.com/gitversenews/738

View MORE
Open in Telegram


Telegram News

Date: |

“Hey degen, are you stressed? Just let it all out,” he wrote, along with a link to join the group. Avoid compound hashtags that consist of several words. If you have a hashtag like #marketingnewsinusa, split it into smaller hashtags: “#marketing, #news, #usa. Hui said the messages, which included urging the disruption of airport operations, were attempts to incite followers to make use of poisonous, corrosive or flammable substances to vandalize police vehicles, and also called on others to make weapons to harm police. Each account can create up to 10 public channels
from us


Telegram GitVerse News
FROM American