Упражнение: выбрать из текста id багтрекерных тикетов

...

Задача

Найти все id Jira-тикетов в предложенном текстовом файле.
Посчитать статистику:
- тикеты из каких проектов встречаются
- по сколько тикетов из каждого проекта
- какие типы тикетов встречаются сколько раз

Идентификатор тикета – это строчка вроде PLC4X-323 или AXIOM-508. Здесь PLC4X и AXIOM – это проекты, а 323 и 508 – номера тикетов в этих проектах.

Тип тикета – это строчки вроде Bug или New Feature.

Данные

Первый файл: здесь

Просто для информации, откуда взялся этот текст: я поискала в багтрекере Apache software foundation тикеты, помеченные языком Java и созданные между 1 и 15 ноября 2021 года (Ссылка на поиск, JQL-запрос: Language = java AND Created >= 2021-11-01 AND Created <= 2021-11-15). Потом я скопировала из браузера блок с результатами поиска и сохранила как текстовый файл.

Еще файлы:

Эти файлы я выгрузила из другой открытой джиры, ссылка на поиск: вот. В этих двух файлах тикеты должны быть только из одного проекта.

Погнали?

Сколько тикетов нашлось?
Сколько проектов?
Из какого проекта больше всего тикетов?
Какие типы тикетов?
Сколько времени заняло решение?

Почему мне нравится это упражнение

Задача маленькая
сложных знаний не требуется
при этом работа характерная и реалистичная для командной строки
и конечно, это обработка текста