Что такое нормализация в анализе данных? Данные из разных источников часто имеют различные единицы измерения и масштабы, что затрудняет их сравнение и анализ. После нормализации значения переменных преобразуются к безразмерным величинам, например, в диапазон от 0 до 1 или от -1 до 1. Нормализация — это композиция двух преобразований: сдвига и масштабирования f(Xi) = (Xi - Y) / S Xi — каждое i-ое значение переменной Y — коэффициент, который отвечает за перенос (сдвиг) S — коэффициент, который отв...
crocodata | Что делать с данными?
Математика, статистика, машинное обучение и инструменты для анализа данных
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20Линейная комбинация векторов Это фундаментальный инструмент для понимания и преобразования данных, который позволяет строить новые векторы и анализировать их взаимосвязи 1. Определение линейной зависимости Система векторов называется линейно зависимой, если существует их нетривиальная линейная комбинация, равная нулевому вектору. Это означает, что один вектор может быть представлен как линейная комбинация остальных, и он не предоставляет новой информации. 2. Преобразование данных Линейные комбин...
MinMax нормализация Это преобразование исходных данных в заданный диапазон, обычно от 0 до 1 f(Xi) = (Xi - Y) / S Xi — каждое i-ое значение переменной Y = min(X) — минимальное значение переменной S = max(X) - min(X) — разница между максимальным и минимальным значениями переменной
Как в Excel преобразовать число в текст? 1. Для преобразования в той же ячейке — введите перед числом апостроф: '12345 2. Для преобразования в другой ячейке — используйте конкатенацию строк или функцию ТЕКСТ: =ссылка на ячейку+"" =ТЕКСТ(ссылка на ячейку; 0) 👇 Изучаем ввод данных в Excel https://crocodata.io/series/xls2
Как Excel хранит дату и время? Дата и время в Excel являются числовым типом данных — это число с целой и дробной частью Целая часть — порядковый номер дня, начиная с 01 января 1900 года, до некоторой даты Дробная часть — доля от суток, в перерасчете на часы, минуты или секунды 👇 Изучаем ввод данных в Excel https://crocodata.io/series/xls2
Косинусное сходство между векторами В анализе данных косинус угла между векторами характеризует их сходство (коэффициент корреляции), например, в задачах кластеризации или машинного обучения с учителем Угол острый — векторы сонаправлены Угол нулевой – векторы перпендикулярны Угол тупой — векторы противоположно направлены 👇 Изучаем векторы https://crocodata.io/series/la2
Стандартизация данных Это нормализация исходных данных таким образом, что их мера средней тенденции становится равной 0, а мера разброса — единице f(Xi) = (Xi - Y) / S Xi — каждое i-ое значение переменной Y = mean(X) или median(X) — мера средней тенденции S = sd(X) или IQR(X) — мера разброса
Проблема с десятичным разделителем в Excel В русскоязычной версии Excel в качестве десятичного разделителя используется запятая и все числа, записанные с использованием точки распознаются как текст или (иногда) как даты. 1. Изменить системный десятичный разделитель можно в меню Файл > Параметры > Дополнительно > Параметры редактирования 2. Для замены точек на запятые в выделенных ячейках используйте меню Найти и заменить 👇 Изучаем ввод данных в Excel https://crocodata.io/series/xls2
Линейная оболочка 1. Для одного вектора — это множество всех его скалярных кратных на прямой 2. Для 2 коллинеарных векторов — это множество всех коллинеарных им векторов на прямой 3. Для 2 неколлинеарных векторов — это множество всех векторов образованной ими плоскости 👇 Изучаем векторы https://crocodata.io/series/la2
Как получить длину вектора? Длину вектора можно представить как расстояние между точкой его начала и точкой его конца Так как длина вектора является результатом векторной нормы, то определить её можно по-разному, используя разные функции расстояния Например: для нахождения длины двумерного вектора на плоскости с евклидовой нормой необходимо возвести каждую координату в квадрат, сложить полученные квадраты и извлечь квадратный корень из полученной суммы 👇 Изучаем векторы https://crocodata.io/ser...