1. Мета-дополненная настройка подсказок для лучшего обучения за несколько выстрелов (arXiv)

Автор: Кайхан Пань, Цзюньчэн Ли, Хунъе Сун, Цзюнь Линь, Сяочжун Лю, Силиан Тан.

Аннотация: Настройка подсказок — это метод с эффективным использованием параметров, который замораживает все параметры PLM и только добавляет некоторые дополнительные настраиваемые токены, называемые мягкими подсказками, к входному тексту. Однако мягкие подсказки в значительной степени зависят от лучшей инициализации и могут легко привести к переобучению при настройках с несколькими выстрелами, что приводит к тому, что подсказка работает намного хуже, чем точная настройка. Чтобы решить вышеуказанные проблемы, в этой статье предлагается новая структура самоконтролируемого мета-подсказки с МЕтаградиентной регуляризацией для обобщения нескольких выстрелов (ЛЕТО). Мы используем самоконтролируемое метаобучение для лучшей инициализации программных подсказок, а также предлагается расширение задач на основе учебной программы для обогащения распределения метазадач. Кроме того, новый метод регуляризации мета-градиента интегрирован в структуру обучения мета-подсказки, которая мета-обучается преобразовывать необработанный градиент во время обучения с несколькими выстрелами в направление, обобщаемое предметной областью, тем самым облегчая проблему переобучения. Обширные эксперименты показывают, что SUMMER обеспечивает более высокую производительность для различных задач с небольшим количеством шагов, а также демонстрирует более сильную способность к обобщению предметной области.

2. Удаленное ориентированное на задачу обучение области захвата неспециалистами посредством интерактивной сегментации и обучения за несколько шагов (arXiv)

Автор: Фуркан Кайнар, Сударшан Раджагопалан, Шаобо Чжоу, Экехард Штайнбах.

Аннотация: Робот, работающий в неструктурированной среде, должен уметь различать разные стили захвата в зависимости от предполагаемой задачи манипулирования. Наличие системы, которая позволяет учиться на удаленных демонстрациях для неспециалистов, может весьма реально расширить когнитивные навыки робота для ориентированного на задачу захвата. Мы предлагаем новый двухэтапный подход к достижению этой цели. Первый шаг включает оценку области охвата путем сегментации. Мы получаем демонстрации области охвата для новой задачи с помощью интерактивной сегментации и учимся на этих нескольких демонстрациях оценивать необходимую область захвата на невидимой сцене для данной задачи. Второй шаг — автономная оценка схватывания в сегментированной области. Чтобы обучить сеть сегментации для обучения с несколькими выстрелами, мы создали набор данных сегментации области охвата (GAS) с 10089 изображениями, сгруппированными в 1121 задачу сегментации. Мы извлекаем выгоду из эффективного алгоритма метаобучения для обучения адаптации с несколькими выстрелами. Экспериментальная оценка показала, что наш метод успешно определяет правильную область захвата на соответствующих объектах в невидимых тестовых сценах и эффективно позволяет дистанционно обучать новым стратегиям захвата неспециалистами.