您好、欢迎来到现金彩票网!
当前位置:2019跑狗图高清彩图 > 向量化 >

SSE4的版本

发布时间:2019-07-22 05:49 来源:未知 编辑:admin

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  不过与以往不同,英特尔将SSE4分为了4.1和4.2两个版本,因此45纳米Penryn核心处理器中,只集成了SSE4.1版本。而SSE4.2指令集则在新一代Nehalem架构处理器上为我们带出。那么新的SSE 4.1指令集拥有哪些特别之处呢?一起来看看吧!

  SSE4.1版本的指令集新增加了47条指令,主要针对向量绘图运算、3D游戏加速、视频编码加速及协同处理的加速。英特尔方面指出,在应用SSE4指令集后,45纳米Penryn核心额外提供了2个不同的32位向量整数乘法运算支持,并且在此基础上还引入了8位无符号最小值和最大值以及16位、32位有符号和无符号的运算,能够有效地改善编译器编译效率,同时提高向量化整数和单精度运算地能力。另外,SSE4.1还改良了插入、提取、寻找、离散、跨步负载及存储等动作,保证了向量运算地专一化。

  SSE4.1还加入了6条浮点型运算指令,支援单、双精度地浮点运算及浮点产生操作。其中IEEE 754指令可实现立即转换运算路径模式,大大减少延迟,保证数据运算通道的畅通。而这些改变,对于进行3D游戏和相关的图形制作是具有相当深远的意义。除此之外,SSE4.1指令集还加入了串流式负载指令,可提高图形帧缓冲区的读取数据频宽,理论上可获取完整的缓存行,即单次性读取64位而非原来的8位 ,并可保持在临时缓冲区内让指令最多带来8倍的读取频宽效能提升。对于图形处理器与中央处理器之间的数据共享起到重要作用。

  SSE4.2则是在新一代Nehalem架构基于Core微架构的SSE4.1指令集上,新增的7组指令,有别于SSE4.1主要针对加快处理器的多媒体处理,例如图形显示、视频编码及处理、3D图像处理、计算机游戏等,SSE4.2主要针对字符串和文本处理指令应用。SSE4.2指令集可再细分为STTNI及ATA2个组别;STTNI主要是加速字符串及文本处理,例如XML应用进行高速查找及对比,相较以软件运算,SSE4.2提供约3.8倍的速度,提升及节省2.7倍指令周期,对服务器应用有显著效能改善。

  完整的SSE4指令集已同时被2011年底AMD新推出的推土机架构处理器兼容支持。

http://chinoamobi.com/xianglianghua/315.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有