博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【记录一个问题】cv::cuda::dft()比cv::dft()慢很多
阅读量:6881 次
发布时间:2019-06-26

本文共 743 字,大约阅读时间需要 2 分钟。

具体的profile调用图如下:

 

可以看见compute很快,但是构造函数很慢。

 

nvidia官网看到几篇类似的帖子,但是没有讲明白怎么解决的:

opencv上的参考文档:

https://docs.opencv.org/3.4/d9/d88/group__cudaarithm__arithm.html#gadea99cb15a715c983bcc2870d65a2e78

https://devtalk.nvidia.com/default/topic/1014986/gpu-accelerated-libraries/opencv-dft-vs-gpu-dft-performance-/

OpenCV dft vs. gpu::dft Performance 
https://devtalk.nvidia.com/default/topic/1020341/transfer-data-cpu-gpu-is-an-issue-/
Transfer data CPU/GPU is an issue.. 
========================================================
采用类的方式,避免频繁初始化(但是未验证数据是否准确),性能有所提升,但是仍然比CPU版本的慢。

cv::Ptr<cv::cuda::DFT> dft_handle = cv::cuda::createDFT(d_mul.size(), 0);
dft_handle->compute(d_mul, d_complex_result, stream);

 

转载于:https://www.cnblogs.com/ahfuzhang/p/10999730.html

你可能感兴趣的文章
生成excel表报的控件FlexCel Studio for .NET
查看>>
使用SCVMM 2012 R2管理Hyper-v群集
查看>>
【开源社群系统研发日记五】ThinkSNS+ 是如何计算字符显示长度的
查看>>
Nodejs日志管理log4js
查看>>
php全文搜索引擎xunsearch的搭建
查看>>
HTTP 常见错误代码与含义
查看>>
我的友情链接
查看>>
不常用的console命令(一)
查看>>
control reaches end of non-void block
查看>>
MySQL Study之--MySQL schema_information数据库
查看>>
Hexo在github上搭载个人博客
查看>>
手机秒变IoT设备?——巧妙利用阿里云物联网平台
查看>>
跟黄哥学python序列文章之python 函数是第一类对象
查看>>
vue组件系列1、弹窗
查看>>
2013最多“情人节”婚庆网购窝窝商城掀热潮
查看>>
【转】linux下搭建生成HLS所需的.ts和.m3u8文件
查看>>
开通51cto博客
查看>>
数据与网络开发
查看>>
[转载] 基于扩展UML的多Agent系统建模方法
查看>>
【Java】 迭代 Map
查看>>