﻿<?xml version="1.0"?>
<?xml-stylesheet type="text/css" href="http://v.michm.ru/skins/common/feed.css?303"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
		<id>http://v.michm.ru/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=%D0%9F%D0%B8%D1%87%D1%83%D0%B3%D0%B8%D0%BD+%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB</id>
		<title>Wiki - Вклад участника [ru]</title>
		<link rel="self" type="application/atom+xml" href="http://v.michm.ru/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=%D0%9F%D0%B8%D1%87%D1%83%D0%B3%D0%B8%D0%BD+%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB"/>
		<link rel="alternate" type="text/html" href="http://v.michm.ru/index.php/%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:Contributions/%D0%9F%D0%B8%D1%87%D1%83%D0%B3%D0%B8%D0%BD_%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB"/>
		<updated>2026-06-08T15:12:05Z</updated>
		<subtitle>Вклад участника</subtitle>
		<generator>MediaWiki 1.19.23</generator>

	<entry>
		<id>http://v.michm.ru/index.php/%D0%91%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D0%B5_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5_2022_%D0%BE%D1%81%D0%B5%D0%BD%D1%8C</id>
		<title>Большие данные 2022 осень</title>
		<link rel="alternate" type="text/html" href="http://v.michm.ru/index.php/%D0%91%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D0%B5_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5_2022_%D0%BE%D1%81%D0%B5%D0%BD%D1%8C"/>
				<updated>2022-09-16T10:36:17Z</updated>
		
		<summary type="html">&lt;p&gt;Пичугин Михаил: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;09.09.2022 Лекция 1. [https://disk.yandex.ru/i/zUDZ2oQZefComw Презентация Лекции 1]&lt;br /&gt;
&lt;br /&gt;
Задание 1: ВСЕМ студентам - завести аккаунт на Yandex (почту)с реальными ФИО&lt;br /&gt;
&lt;br /&gt;
Задание 2: просмотреть инструкции (в особенности - определения!) [https://cloud.yandex.ru/docs/datasphere/quickstart DataSphere]&lt;br /&gt;
&lt;br /&gt;
[https://cloud.yandex.ru/ Yandex.Cloud]&lt;br /&gt;
&lt;br /&gt;
Задание 3: сделать любой пример по аналогии с документацией на DataLens&lt;br /&gt;
&lt;br /&gt;
Пичугин [https://datalens.yandex.ru/ntwjrs1b638ke-dash Дашборд Карта продаж]&lt;br /&gt;
&lt;br /&gt;
Шишко: [https://datalens.yandex/qwygw4qqkwlqh Погода]&lt;br /&gt;
&lt;br /&gt;
Марьин: [https://datalens.yandex/gmo66ijn3bhu7 Дашборд]&lt;br /&gt;
&lt;br /&gt;
Макляев: [https://datalens.yandex/17auxi2qlrp0s]&lt;br /&gt;
&lt;br /&gt;
Сидоров: [https://datalens.yandex/gmp7couprt4e7 Коронавирус]&lt;br /&gt;
&lt;br /&gt;
Поляков: [https://datalens.yandex/8eh0bvvcx6d2z Выручка]&lt;br /&gt;
&lt;br /&gt;
Фицева: [https://datalens.yandex/lruczq77o0a8c?state=c557b68b135 Дашбор погода]&lt;br /&gt;
&lt;br /&gt;
Егоров: [https://datalens.yandex/flo6zksjtirw6]&lt;br /&gt;
&lt;br /&gt;
Ноль: [https://datalens.yandex/4aj41cawtwzmv Погода]&lt;br /&gt;
&lt;br /&gt;
Чернова: [https://datalens.yandex/x36syivsb2vgo Dashboard]&lt;br /&gt;
&lt;br /&gt;
Оралов: [https://datalens.yandex/z58w91c7cyb8q Дашборд]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Басистый: [https://datalens.yandex/39cunfqjta0ou]&lt;br /&gt;
&lt;br /&gt;
[https://datalens.yandex.ru/gmp7l0z7w7vi7-koronavirus-dashbord Пример]&lt;br /&gt;
&lt;br /&gt;
16.09.2022:&lt;br /&gt;
&lt;br /&gt;
Azure:&lt;br /&gt;
&lt;br /&gt;
[https://www.youtube.com/watch?v=uWIT6kDq7s4 Machine Learning in Azure 1 часть 1]&lt;br /&gt;
&lt;br /&gt;
[https://www.youtube.com/watch?v=O86mibwJpXU Machine Learning in Azure 1 часть 2]&lt;br /&gt;
&lt;br /&gt;
[https://www.youtube.com/watch?v=lwWk64lqKbk Machine Learning in Azure 2]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[https://www.youtube.com/watch?v=0nnC8MCHInk Machine Learning in Azure 3]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Старые материалы: &lt;br /&gt;
&lt;br /&gt;
8.04.2022&lt;br /&gt;
&lt;br /&gt;
[https://docs.sbercloud.ru/aicloud/mlspace/doc-contents.html Ml Sbercloud]&lt;br /&gt;
&lt;br /&gt;
[https://docs.sbercloud.ru/s3/ug/index.html S3]&lt;br /&gt;
&lt;br /&gt;
[https://docs.sbercloud.ru/platform-v-kafka-sber-edition/ug/index.html Kafka]&lt;br /&gt;
&lt;br /&gt;
[https://docs.sbercloud.ru/dli/ug/index.html Data Lake Insight]&lt;br /&gt;
&lt;br /&gt;
[https://docs.sbercloud.ru/mrs/ug/index.html MapReduce Service]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Для проработки 04.04.2022:&lt;br /&gt;
&lt;br /&gt;
[https://www.striim.com/blog/change-data-capture-cdc-what-it-is-and-how-it-works/ Change Data Capture (CDC): What it is and How it Works]&lt;br /&gt;
&lt;br /&gt;
[https://biconsult.ru/services/etl-i-elt-5-osnovnyh-otlichiy ETL и ELT: 5 основных отличий]&lt;br /&gt;
&lt;br /&gt;
[https://medium.com/whatnot-engineering/building-a-modern-data-stack-at-whatnot-afc1d03c3f9m Building a Modern Data Stack at Whatnot]&lt;br /&gt;
&lt;br /&gt;
[https://engineering.grab.com/real-time-data-ingestion Real-time data ingestion in Grab]&lt;br /&gt;
&lt;br /&gt;
[https://www.bigdataschool.ru/wiki/data-lake Data Lake]&lt;br /&gt;
&lt;br /&gt;
[https://towardsdatascience.com/the-key-feature-behind-lakehouse-data-architecture-c70f93c6866f The Key Feature Behind Lakehouse Data Architecture]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Для проработки 28.03.2022:&lt;br /&gt;
&lt;br /&gt;
[https://www.bigdataschool.ru/wiki/spark Spark]&lt;br /&gt;
&lt;br /&gt;
[https://www.bigdataschool.ru/wiki/yarn YARN]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[https://www.bigdataschool.ru/wiki/hdfs HDFS]&lt;br /&gt;
&lt;br /&gt;
[https://www.bigdataschool.ru/wiki/cassandra Cassandra]&lt;br /&gt;
&lt;br /&gt;
[https://www.bigdataschool.ru/wiki/kafka Kafka]&lt;br /&gt;
&lt;br /&gt;
[https://www.youtube.com/watch?v=3h6VWJLK31U Ролик Spark]&lt;br /&gt;
&lt;br /&gt;
[https://www.youtube.com/watch?v=sVA-jJvhoME Hadoop]&lt;br /&gt;
&lt;br /&gt;
-----&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Лекции и общие задания&lt;br /&gt;
&lt;br /&gt;
07.02.2022 Лекция 1. &lt;br /&gt;
&lt;br /&gt;
Задание 1: ВСЕМ студентам - завести аккаунт на Yandex (почту)с реальными ФИО&lt;br /&gt;
&lt;br /&gt;
Задание 2: просмотреть инструкции (в особенности - определения!) [https://cloud.yandex.ru/docs/datasphere/quickstart DataSphere]&lt;br /&gt;
&lt;br /&gt;
[https://cloud.yandex.ru/ Yandex.Cloud]&lt;br /&gt;
&lt;br /&gt;
14.02.2022 Занятие по YandexCloud&lt;br /&gt;
&lt;br /&gt;
Команда: Корсаков, Демин, Тодорич, Глянцев, Луцикова&lt;br /&gt;
&lt;br /&gt;
Получилось сделать перевод введенного текста на python. Скрипт соединяется с сервисом yandex'а и, пользуясь своими ресурсами, переводит текст возвращая json строку, из которой достается переведенный текст. &lt;br /&gt;
Были использованы документации для успешной работы, а именно: &lt;br /&gt;
&lt;br /&gt;
Для получения IAM-Токена: https://cloud.yandex.ru/docs/iam/operations/iam-token/create&lt;br /&gt;
&lt;br /&gt;
Соединением с сервисом яндекса: https://cloud.yandex.ru/docs/translate/operations/translate&lt;br /&gt;
&lt;br /&gt;
Получив IAM-Токен и идентификатор каталога не составило труда дописать скрипт.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Команда: Алешин, Жижин, Кузнецов, Кузьминых, Гакиев, Сафин, Салимов, Иванов&lt;br /&gt;
&lt;br /&gt;
При работе через сайт не принимает файл .wav (ошибка 400)&lt;br /&gt;
&lt;br /&gt;
С помощью команды yc iam create-token в cmd получили IAM-Токен.&lt;br /&gt;
Из каталога скопировали его идентификатор.&lt;br /&gt;
С помощью примера использования API получилось достать из файла расширения .pcm текст(https://cloud.yandex.ru/docs/speechkit/stt/api/streaming-examples). С файлами другого расширения результата получить не удалось.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Команда: Битарова, Перминова, Суржикова, Счастливая&lt;br /&gt;
&lt;br /&gt;
Работали с Yandex Translate. Перевод текста осуществлялся на python.&lt;br /&gt;
&lt;br /&gt;
Во-первых, мы нашли OAuth-токен, который впоследствии обменяли на нужный нам IAM-токен. Обмен осуществлялся с помощью Windows PowerShell. Далее нужный программный код, для перевода текста, мы загрузили в онлайн-компилятор. Было проведено 2 запроса: с английского языка на русский, и наоборот - с русского на английский.&lt;br /&gt;
Оба запроса выполнились успешно: показывался перевод слова и с какого языка было переведено.&lt;br /&gt;
&lt;br /&gt;
Ссылка на скрины с кодом и результатом его выполнения:https: https://disk.yandex.ru/d/83ljw6TT0IhNgA&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Команда: Магеррамов, Киселева, Колесников, Лапина&lt;br /&gt;
&lt;br /&gt;
Работа с Yandex Speechkit. Cоздан платежный аккаунт, с помощью Windows PowerShell получен IAM-токен для дальнейшей работы с сервисом. На языке программирования python написана программа, позволяющая переводить полученный на вход текст в аудиофайл формата .raw. Планировалось внутри программы конвертировать формат .raw в .wav с помощью утилиты sox, рекомендуемой YandexCloud. По какой-то причине конвертация не работает, но для проверки результата была скачана сторонняя программа, позволяющая изменить формат и прослушать аудиозапись.&lt;br /&gt;
&lt;br /&gt;
Код программы и рабочая аудиозапись по ссылке на диске: https://drive.google.com/drive/folders/1tMqvjJgG_8OG9VOKjp1BEZBrQ9CSR3eR?usp=sharing&lt;br /&gt;
&lt;br /&gt;
Azure: проработаны обучающие видео по курсу машинного обучения в среде Azure&lt;br /&gt;
&lt;br /&gt;
Проработаны большие данные (базы данных), такие как: Spark, Yarn, Cassandra и другие. &lt;br /&gt;
Выявлены ряды плюсов и минусов каждой из баз данных (архитектурные особенности, компонентность,&lt;br /&gt;
клиентоориентированность и, непосредственно, функционал)&lt;br /&gt;
&lt;br /&gt;
Объектное хранилище: познакомились с облаком Sber Cloud. В S3 можно хранить данные в любом формате, будь то аудио или видео файлы, документы, электронные письма, персональные данные, резервные копии, образы виртуальных машин, данные для работы приложений, BigData и так далее. При этом данные хранятся в исходном формате, без каких-либо преобразований.&lt;br /&gt;
&lt;br /&gt;
Стоит отметить, что данные в хранилище размещаются в виде объектов в плоском адресном пространстве (без иерархии) — это позволяет приложениям быстрее получать доступ к объектам и работать с хранилищем по протоколу HTTP/HTTPS, - несомненный плюс данной структуры.&lt;br /&gt;
&lt;br /&gt;
Познакомились и проработали информацию о программном продукте Platform V Kafka, который предназначен для автоматизации развертывания, масштабирования контейнеризированных приложений и управления ими с использованием платформы Kubernetes путем предоставления REST API (то есть программный интерфейс приложений, описание способов для обмена данными между приложениями). &lt;br /&gt;
&lt;br /&gt;
Об архитектурной организации сбербанка подробнее рассказал работник из данной организации. Глубже посвятил в структуру базы данных, рассказал подробнее о сервисах обработки и анализа больших данных, работающих на базе системы Apache Spark (Data Lake Insight (DLI)). Также был затронут MapReduce Service (MRS) — надежная, безопасная и простая в использовании платформа корпоративного уровня для хранения, обработки и анализа больших данных.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Успехи выполнения:&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[https://cloud.yandex.ru/docs/datasphere/pricing Правила тарификации для DataSphere]&lt;br /&gt;
&lt;br /&gt;
[https://cloud.yandex.ru/docs/datasphere/security/ Настройки прав доступа]&lt;br /&gt;
&lt;br /&gt;
[https://cloud.yandex.ru/docs/datasphere/public-talks вебинары]&lt;br /&gt;
&lt;br /&gt;
[https://cloud.yandex.ru/docs/datasphere/tutorials/ Руководства]&lt;br /&gt;
&lt;br /&gt;
[https://cloud.yandex.ru/docs/datasphere/concepts/ Понятия и конфигурации]&lt;/div&gt;</summary>
		<author><name>Пичугин Михаил</name></author>	</entry>

	</feed>