Практика «Частотность N-грамм» Продолжайте работу в том же проекте. N-грамма — это N соседних слов в одном предложении. 2-граммы называют биграммами. 3-граммы — триграммами. Например, из текста: «She stood up. Then she left.» можно выделить следующие биграммы «she stood», «stood up», «then she» и «she left», но не «up then». И две триграммы «she stood […]
Решения задачи с Ulearn
Практика «Парсер предложений» Скачайте проект TextAnalysis В этом задании нужно реализовать метод в классе SentencesParserTask. Метод должен делать следующее: Разделять текст на предложения, а предложения на слова. a. Считайте, что слова состоят только из букв (используйте метод char.IsLetter) или символа апострофа ‘ и отделены друг от друга любыми другими символами. b. Предложения состоят из слов […]
Решения задачи с Ulearn
Практика «Тестирование» На вход программе подается строка текста. На выход нужно вернуть массив полей, извлечённых из входа, либо пустой массив если полей нет. Поля могут быть двух типов: Простые поля Не могут быть пустыми, не могут содержать пробелов и разделяются одним или несколькими пробелами. Поля в кавычках Могут содержать пробелы и быть пустыми. То есть […]
Решения задачи с Ulearn
Практика «Тепловая карта» В том же проекте в классе HeatmapTask напишите код подготовки данных для тепловой карты рождаемости в зависимости от дня и месяца для заданного имени. Подготовьте данные для построения карты интенсивностей, у которой по оси X — число месяца, по Y — номер месяца, а интенсивность точки (она отображается цветом и размером) обозначает […]
Решения задачи с Ulearn
Практика «Гистограмма» Скачайте проект Names и изучите его. В классе HistogramTask напишите код подготовки данных для гистограммы частоты рождаемости в зависимости от числа (номера дня в месяце) их рождения для заданного имени. В это задаче используются реальные данные о людях. Но так получилось, что в базе данных для всех людей с неизвестной датой рождения, в […]