Упражнение: выбрать из текста id багтрекерных тикетов
...
Задача
- Найти все id Jira-тикетов в предложенном текстовом файле.
- Посчитать статистику:
- тикеты из каких проектов встречаются
- по сколько тикетов из каждого проекта
- какие типы тикетов встречаются сколько раз
Идентификатор тикета – это строчка вроде PLC4X-323
или AXIOM-508
.
Здесь PLC4X
и AXIOM
– это проекты, а 323 и 508 – номера тикетов в этих проектах.
Тип тикета – это строчки вроде Bug
или New Feature
.
Данные
Первый файл: здесь
Просто для информации, откуда взялся этот текст: я поискала в багтрекере Apache software foundation тикеты, помеченные языком Java и созданные между 1 и 15 ноября 2021 года
(Ссылка на поиск,
JQL-запрос: Language = java AND Created >= 2021-11-01 AND Created <= 2021-11-15
).
Потом я скопировала из браузера блок с результатами поиска и сохранила как текстовый файл.
Еще файлы:
Эти файлы я выгрузила из другой открытой джиры, ссылка на поиск: вот. В этих двух файлах тикеты должны быть только из одного проекта.
Погнали?
- Сколько тикетов нашлось?
- Сколько проектов?
- Из какого проекта больше всего тикетов?
- Какие типы тикетов?
- Сколько времени заняло решение?
Почему мне нравится это упражнение
- Задача маленькая
- сложных знаний не требуется
- при этом работа характерная и реалистичная для командной строки
- и конечно, это обработка текста