У меня есть таблица с двумя столбцами:
+---------+--------+
| keyword | color |
+---------+--------+
| foo | red |
| bar | yellow |
| fobar | red |
| baz | blue |
| bazbaz | green |
+---------+--------+
Мне нужно сделать какое-то однократное кодирование и преобразовать таблицу в PostgreSQL, чтобы:
+---------+-----+--------+-------+------+
| keyword | red | yellow | green | blue |
+---------+-----+--------+-------+------+
| foo | 1 | 0 | 0 | 0 |
| bar | 0 | 1 | 0 | 0 |
| fobar | 1 | 0 | 0 | 0 |
| baz | 0 | 0 | 0 | 1 |
| bazbaz | 0 | 0 | 1 | 0 |
+---------+-----+--------+-------+------+
Можно ли обойтись только SQL? Любые советы о том, как начать?
one-hot encoding
? - person Siyual   schedule 10.08.2017bit
илиcount
? - person Siyual   schedule 10.08.2017CASE WHEN
для каждого цвета. Если парыkeyword
иcolor
не уникальны, необходимо добавить агрегацию. - person PM 77-1   schedule 10.08.2017bit
, 1 — правда, 0 — ложь. - person Ernest   schedule 10.08.2017