Публикации по теме 'data'
От пакетов к потокам: как ориентироваться в жизненном цикле продукта данных: подробное руководство (часть…
TLDR
В этой статье рассматривается жизненный цикл продукта данных, описываются этапы от концепции до вывода из эксплуатации, а также подчеркивается важность учета таких факторов, как размер компании, отрасль и уровень зрелости. Он охватывает выбор метода обработки и роль технологических затрат, скорости и обслуживания, а также тематические исследования с участием Uber на разных этапах. Статья завершается обсуждением ограничений, требующих внимания в четвертом поколении жизненного цикла..
Как получить максимальную точность для модели машинного обучения?
Получение максимальной точности для модели машинного обучения зависит от нескольких факторов, включая качество данных, выбор алгоритма, настройку гиперпараметров и процесс обучения.
Что такое машинное обучение?
Основная идея машинного обучения заключается в создании алгоритма или модели, которые могут распознавать шаблоны в данных и использовать эти шаблоны для прогнозирования или принятия решений в отношении новых данных . Алгоритмы машинного обучения могут быть контролируемыми,..
Исследовательские работы, основанные на выводе естественного языка (NLI), часть 1 [Искусственный интеллект]
Утечка отношений в извлеченных наборах данных вывода на естественном языке ( arXiv )
Автор: Майкл Саксон , Синьи Ван , Венда Сюй , Уильям Ян Ван
Аннотация . Вывод естественного языка (NLI) — важная задача для создания полезных моделей человеческого языка. К сожалению, крупномасштабное производство наборов данных NLI зависит от краудворкеров, которые склонны вносить предвзятость в предложения, которые они пишут, что позволяет моделям предсказывать отношения пар предложений..
Понимание расслоений в алгебраической топологии часть 3
Особые лагранжевы расслоения на тор на сглаживании алгебраических конусов (arXiv)
Автор: Сантьяго Ачиг-Андранго
Аннотация: данный решетчатый многогранник Q⊂Rn, мы можем рассмотреть конус σ=C(Q)={λ(q,1)∈Rn+1|λ∈R≥0,q∈Q }⊂Rn+1 и аффинное торическое многообразие Yσ, ассоциированное с σ. Альтманн показал, что пространство версальных деформаций Yσ может быть описано разложением Минковского многогранника Q. При некоторых условиях на Q мы можем получить гладкую деформацию Yε..
Расшифровка бизнес-задач: искусство создания аналитических решений
Определение того, какие проблемы требуют ваших аналитических знаний
Введение
Пытаясь расширить свой опыт в качестве делового, мыслительного и аналитического лидера, я старался читать, посещать семинары и завязывать беседы с аналогичными лидерами в этой области.
Одна из проблем, которую мне часто задают: «Какой аналитический инструмент нам следует использовать для решения [ вставьте бизнес-задачу ]?» В этом вопросе нет ничего принципиально неправильного, на самом деле он имеет..
Pandas Полное руководство (Часть 5)
В этом руководстве мы рассмотрим типы данных и пропущенные значения.
Мы узнаем, как исследовать типы данных в DataFrame или Series и как находить и заменять записи.
Типы данных :
Тип данных для столбца в DataFrame или Series известен как dtype .
Вы можете использовать свойство dtype для получения типа определенного столбца. Например, мы можем получить dtype столбца price в reviews DataFrame:
reviews.price.dtype
В качестве альтернативы свойство dtypes возвращает..
Наука о данных: как использовать большие данные в своих интересах
Максимальное использование больших данных.
Наука о данных — это относительно новая область, которая занимается извлечением смысла из больших наборов данных. Специалисты по данным используют для этого различные методы, включая машинное обучение, статистику и интеллектуальный анализ данных.
Цель науки о данных — находить идеи, которые можно использовать для принятия лучших решений…