Вопросы по теме 'cuda'

Передача GPUArray в feval
У меня есть следующее ядро __global__ void func( float * arr, int N ) { int rtid = blockDim.x * blockIdx.x + threadIdx.x; if( rtid < N ) { float* row = (float*)((char*)arr + rtid*N*sizeof(float) ); for (int c =...
557 просмотров
schedule 24.12.2023

Выбор медианы в ядре CUDA
Мне нужно вычислить медиану массива размера p внутри ядра CUDA (в моем случае p мало, например, p = 10). Я использую алгоритм O(p^2) из-за его простоты, но ценой снижения производительности. Есть ли «функция» для эффективного нахождения медианы,...
4068 просмотров
schedule 15.11.2023

Возврат к коду хоста в pyCUDA после асинхронного запуска ядра
Я пытаюсь запустить ядро ​​​​в pyCUDA, а затем завершить работу ядра, записав в глобальную память графического процессора. Вот простой пример ядра, которое я хотел бы иметь возможность завершить в какой-то момент после входа в бесконечный цикл while:...
900 просмотров
schedule 12.11.2023

Как исправить математические функции, которые не были найдены в cuda_fp16.h
Я пишу программу вычислений CUDA с большим объемом памяти. Мне нужно использовать математические функции, такие как в math.h в моем ядре. Итак, я провел небольшое исследование и наткнулся на «cuda_fp16.h», который должен добавить множество...
458 просмотров
schedule 19.12.2023