Публикации по теме 'analytics'
Управление версиями данных для машинного обучения в Airflow
от Мак Макой
В недавней публикации мы рассказали, почему выбрали Apache Airflow для организации конвейеров машинного обучения в Chick-fil-A. В этом посте мы углубимся в то, как мы улучшили Airflow для поддержки управления версиями данных для машинного обучения.
Воздушный поток в его ядре
По своей сути Airflow — это инструмент оркестровки рабочего процесса, и в этом он прекрасен. Существуют сотни интеграций с открытым исходным кодом, которые упрощают создание рабочего процесса..
Статистические модели имеют свои сильные стороны и полезны во многих сценариях прогнозирования.
Статистические модели имеют свои сильные стороны и полезны во многих сценариях прогнозирования. Однако существуют определенные ситуации, когда статистических моделей может быть недостаточно для получения точных и надежных прогнозов. Вот несколько причин, по которым одни только статистические модели могут не дать прогноза:
Нелинейность . Статистические модели обычно предполагают линейные отношения между переменными. Однако многие явления и системы реального мира демонстрируют..
Креативная визуализация с помощью JS
Я хотел сделать перерыв в анализе данных и изучить альтернативные способы визуализации данных, помимо обыденных гистограмм и линейных графиков.
Я начал с простого эффекта частиц, создав «атомы», имеющие радиус и скорость в направлении x-y, которые случайны, но находятся в пределах определенного диапазона. Переменные обновляются со временем, и атомы исчезают после того, как радиус достигает определенного порога. Положение атомов основано на координатах x и y движения моего курсора. Новые..
Решайте бизнес-проблемы с помощью Data Science
Решайте бизнес-проблемы с помощью Data Science
Обобщенная структура для консалтинговых проектов на основе данных
Обзор
Здесь мы предлагаем общую основу для решения бизнес-задач с помощью науки о данных. Эта 5-ступенчатая структура не только прольет свет на предмет для тех, кто не имеет технического образования, но также позволит энтузиастам данных постоянно и своевременно предоставлять качественные результаты.
Сначала мы начнем с определения наших бизнес-проблем, что поможет..
Pandas Cut и qCut — «Преобразование непрерывных данных в категориальные данные»
Подробные объяснения функций Pandas cut и qcut
Оглавление
∘ Импорт библиотек и создание списка ∘ Сведения о функции cut() ∘ Вычисление границ функции Cut по умолчанию ∘ value_counts() ∘ Маркировка ∘ Сведения о функции qcut() ∘ ValueError: Ребра бина должны быть уникальными
Импортируйте библиотеки и создайте список
Сначала создайте случайный список, содержащий 20 элементов со значениями от 1 до 100.
import pandas as pd
import numpy as np
np.random.randint(100,..
Power BI - фильтр против контекста строки
Простая концепция (с поездами).
Я то, что вы называете «супер-пассажиром». Я просыпался в 5 утра. Выходите за дверь в 5:30, садитесь на поезд и приходите на работу к 8:00. Это похоже на кошмар. Я люблю свою работу, и я люблю ее достаточно, чтобы делать это. Затем пришла пандемия, и мне больше не приходится делать это так часто. Я благодарен за это, но какое это имеет отношение к фильтру Power BI и контексту строки?
Видите ли, контекст фильтра и строки можно увидеть в обычных..
Практическая реализация аналитического иерархического процесса (AHP) в Python
Код Python для реализации AHP: пример лидеров
В этой статье:
Поделюсь практической реализацией AHP на Python, Я не буду подробно объяснять теорию AHP, Будем реализовывать пример из Википедии, Я поделюсь с вами полным кодом.
Вот — пример лидера из Википедии.
В этом примере есть 3 лидера, и нам нужно выбрать лучший вариант с помощью AHP. Критериями являются опыт , образование , харизма и возраст .
Приступаем к реализации.
Импортировать необходимые библиотеки:..
Новые материалы
Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..
Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально
Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..
Частный метод Python: улучшение инкапсуляции и безопасности
Введение
Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..
Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования
Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..
Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv)
Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..
Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..
Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..