Публикации по теме 'data'


От пакетов к потокам: как ориентироваться в жизненном цикле продукта данных: подробное руководство (часть…
TLDR В этой статье рассматривается жизненный цикл продукта данных, описываются этапы от концепции до вывода из эксплуатации, а также подчеркивается важность учета таких факторов, как размер компании, отрасль и уровень зрелости. Он охватывает выбор метода обработки и роль технологических затрат, скорости и обслуживания, а также тематические исследования с участием Uber на разных этапах. Статья завершается обсуждением ограничений, требующих внимания в четвертом поколении жизненного цикла..

Как получить максимальную точность для модели машинного обучения?
Получение максимальной точности для модели машинного обучения зависит от нескольких факторов, включая качество данных, выбор алгоритма, настройку гиперпараметров и процесс обучения. Что такое машинное обучение? Основная идея машинного обучения заключается в создании алгоритма или модели, которые могут распознавать шаблоны в данных и использовать эти шаблоны для прогнозирования или принятия решений в отношении новых данных . Алгоритмы машинного обучения могут быть контролируемыми,..

Исследовательские работы, основанные на выводе естественного языка (NLI), часть 1 [Искусственный интеллект]
Утечка отношений в извлеченных наборах данных вывода на естественном языке ( arXiv ) Автор: Майкл Саксон , Синьи Ван , Венда Сюй , Уильям Ян Ван Аннотация . Вывод естественного языка (NLI) — важная задача для создания полезных моделей человеческого языка. К сожалению, крупномасштабное производство наборов данных NLI зависит от краудворкеров, которые склонны вносить предвзятость в предложения, которые они пишут, что позволяет моделям предсказывать отношения пар предложений..

Понимание расслоений в алгебраической топологии часть 3
Особые лагранжевы расслоения на тор на сглаживании алгебраических конусов (arXiv) Автор: Сантьяго Ачиг-Андранго Аннотация: данный решетчатый многогранник Q⊂Rn, мы можем рассмотреть конус σ=C(Q)={λ(q,1)∈Rn+1|λ∈R≥0,q∈Q }⊂Rn+1 и аффинное торическое многообразие Yσ, ассоциированное с σ. Альтманн показал, что пространство версальных деформаций Yσ может быть описано разложением Минковского многогранника Q. При некоторых условиях на Q мы можем получить гладкую деформацию Yε..

Расшифровка бизнес-задач: искусство создания аналитических решений
Определение того, какие проблемы требуют ваших аналитических знаний Введение Пытаясь расширить свой опыт в качестве делового, мыслительного и аналитического лидера, я старался читать, посещать семинары и завязывать беседы с аналогичными лидерами в этой области. Одна из проблем, которую мне часто задают: «Какой аналитический инструмент нам следует использовать для решения [ вставьте бизнес-задачу ]?» В этом вопросе нет ничего принципиально неправильного, на самом деле он имеет..

Pandas Полное руководство (Часть 5)
В этом руководстве мы рассмотрим типы данных и пропущенные значения. Мы узнаем, как исследовать типы данных в DataFrame или Series и как находить и заменять записи. Типы данных : Тип данных для столбца в DataFrame или Series известен как dtype . Вы можете использовать свойство dtype для получения типа определенного столбца. Например, мы можем получить dtype столбца price в reviews DataFrame: reviews.price.dtype В качестве альтернативы свойство dtypes возвращает..

Наука о данных: как использовать большие данные в своих интересах
Максимальное использование больших данных. Наука о данных — это относительно новая область, которая занимается извлечением смысла из больших наборов данных. Специалисты по данным используют для этого различные методы, включая машинное обучение, статистику и интеллектуальный анализ данных. Цель науки о данных — находить идеи, которые можно использовать для принятия лучших решений…