FuzzyLogic
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору pir0texnik2 "Это нечто другое", с CUDA всё даже несколько сложнее чем с MPI, потому как надо знать особенности железа. И написав что-то под серию железа M совсем не обязательно что это будет хорошо работать на серии железа N вышедшей через год. Делается многое "вручную", т.е. заливаем данные в память видеокарты, программируем стрим процессоры, группируем их, запускаем, сливаем данные, итд. Причём тут и начинаются особенности. потому что в одной серии у вас есть скажем N процессоров с N1 kb кэша каждый (доступ к другой памяти недёшев в плане эффективности), а в другой процессоров стало в 3 раза больше зато кэша меньше. В первой серии процессоры надо программировать кучками по N штук, а во второй по M, ну итд, в общем железо знать придётся. |