|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
现象一:这板子的PCB设计要求不高,就用细一点的线,自动布吧 Qj&uG7 s( b( l x/ j9 ^ z' D. p& S
m7^3]Ijc , L& k3 y9 ~8 V1 | y/ v
点评:自动布线必然要占用更大的PCB面积,同时产生比手动布线多好多倍的过孔,在批量很大的产品中,PCB厂家降价所考虑的因素除了商务因素外,就是线宽和过孔数量,它们分别影响到PCB的成品率和钻头的消耗数量,节约了供应商的成本,也就给降价找到了理由。 r5pWP9C 4 M- _! i) F- p
dH_{~& ' P8 X5 ~$ p7 T2 H$ a
8v%fz~!_=
. M7 b- C2 |1 T3 m. C1 }现象二:这些总线信号都用电阻拉一下,感觉放心些。 /'VHue/ ! E. C" \' D' z: s
"_%ttcV
* n3 s: e# k- L1 z$ T& E2 ^点评:信号需要上下拉的原因很多,但也不是个个都要拉。上下拉电阻拉一个单纯的输入信号,电流也就几十微安以下,但拉一个被驱动了的信号,其电流将达毫安级,现在的系统常常是地址数据各32位,可能还有244/245隔离后的总线及其它信号,都上拉的话,几瓦的功耗就耗在这些电阻上了。 6!Pp@'JpH
1 L4 g, { j" y* E) |" I0 EevYRxt
, x/ Y2 j9 Y5 z# Y9 j: D6 n&Z@HCS('a 9 ~2 H. e" o5 I% n2 E$ U
现象三:CPU和FPGA的这些不用的I/O口怎么处理呢?先让它空着吧,以后再说。 { p~ lGC * D1 k8 C& Q Z) Y8 L
*XD4-EowJj
7 C- ~! W7 ~* A1 ^/ `点评:不用的I/O口如果悬空的话,受外界的一点点干扰就可能成为反复振荡的输入信号了,而MOS器件的功耗基本取决于门电路的翻转次数。如果把它上拉的话,每个引脚也会有微安级的电流,所以最好的办法是设成输出(当然外面不能接其它有驱动的信号) 2B'H %K2iW * Y0 L- M1 N8 L; n. L" ^0 V
V+F3 0{#d # a5 ?, l2 b: p$ W6 e0 X3 q
stE\e/7?e0 7 P1 E5 V0 K& [; k) i
:H$N=|jY5 $ a3 ~$ |1 e2 Y) h
现象四:这款FPGA还剩这么多门用不完,可尽情发挥吧 "KKGsN % l5 L( u+ c; c2 f& {& |, U( g5 N
9r(Hyz'=h ) P8 L+ @# }8 I& b/ n7 v4 L) z
点评:FGPA的功耗与被使用的触发器数量及其翻转次数成正比,所以同一型号的FPGA在不同电路不同时刻的功耗可能相差100倍。尽量减少高速翻转的触发器数量是降低FPGA功耗的根本方法。 a*+.#x % o G9 P' n6 O- d/ h
~4q{ @\f' + b& T. `5 o7 C1 d; U: b$ K: t
%b$)H,5 % O# x; t7 n. f7 ^) o9 }
m{?ft: . S4 F ]1 P2 R( X L
现象五:这些小芯片的功耗都很低,不用考虑 Q "rf
5 Q& b$ ?# E, G<&uJUFT 9 i9 V* [6 V, E0 H
点评:对于内部不太复杂的芯片功耗是很难确定的,它主要由引脚上的电流确定,一个ABT16244,没有负载的话耗电大概不到1毫安,但它的指标是每个脚可驱动60毫安的负载(如匹配几十欧姆的电阻),即满负荷的功耗最大可达60*16=960mA,当然只是电源电流这么大,热量都落到负载身上了。 a%-9]"P{+
( C1 Y9 Y; e4 I" V a5 VSx`5~hj ) W1 w7 Z4 @ j
`wWt\X
# r3 F9 E! U! q4 G/ I( D [" \F6 {5/ ) m1 L( S( v; u+ b; V4 R3 m
现象六:存储器有这么多控制信号,我这块板子只需要用OE和WE信号就可以了,片选就接地吧,这样读操作时数据出来得快多了。 Hq>E3P.KD
' O) l5 u2 h9 ^% @# S&1ZcX [
7 z) Y2 C [) e* ~点评:大部分存储器的功耗在片选有效时(不论OE和WE如何)将比片选无效时大100倍以上,所以应尽可能使用CS来控制芯片,并且在满足其它要求的情况下尽可能缩短片选脉冲的宽度。 3Xc>1SE*
0 K6 A6 J9 t7 Lhly ,)XzW
* p" |4 @& _. t/ m)9o(X; V"
1 \4 P3 |5 [/ h. `8 W;1 c7#pYB 5 F$ D) t% i: Y% v$ O2 x
现象七:这些信号怎么都有过冲啊?只要匹配得好,就可消除了 =8{gb
+ J6 V0 G# V0 a- x& h v7 D; R( g, QHiud % O( J4 W0 I9 J f2 k. G) c X2 n' E
点评:除了少数特定信号外(如100BASE-T、CML),都是有过冲的,只要不是很大,并不一定都需要匹配,即使匹配也并非要匹配得最好。象TTL的输出阻抗不到50欧姆,有的甚至20欧姆,如果也用这么大的匹配电阻的话,那电流就非常大了,功耗是无法接受的,另外信号幅度也将小得不能用,再说一般信号在输出高电平和输出低电平时的输出阻抗并不相同,也没办法做到完全匹配。所以对TTL、LVDS、422等信号的匹配只要做到过冲可以接受即可。 BJkHba]$ / f4 U( a3 S. n# L/ k5 {9 q- h' J/ i9 a7 x
"=%Wh nqS
4 f# j/ y- B% h S9 M; E-|({F)0
4 ^) A! q" q; e- P( |/ ?( r+ wP_W* sc / {7 n U. z$ f3 m/ N$ L, c6 j
现象八:降低功耗都是硬件人员的事,与软件没关系. @ ( V\`
# U7 Q1 B3 X8 K" l0 Rb$[jua<
5 E2 w# ]$ c1 K点评:硬件只是搭个舞台,唱戏的却是软件,总线上几乎每一个芯片的访问、每一个信号的翻转差不多都由软件控制的,如果软件能减少外存的访问次数(多使用寄存器变量、多使用内部CACHE等)、及时响应中断(中断往往是低电平有效并带有上拉电阻)及其它争对具体单板的特定措施都将对降低功耗作出很大的贡献。 Z*B}w]JH
l- V6 l* }9 u5 L# v*trc%{B 4 @8 U. ]0 T3 ^9 D, j2 {- e+ w
HQynCvq/Q_ " b2 Z$ u/ M) N: o+ \8 L; d/ R
Cw@/F6 X
( Y- l- H2 _9 i9 P: v* s: ~' K1 V现象九:CPU用大一点的CACHE,就应该快了 Fp]bh*T" 3 V+ i" N# }, H( H' r1 M
\w#FsaA6=
! a8 A* v/ h( x/ I2 H点评:CACHE的增大,并不一定就导致系统性能的提高,在某些情况下关闭CACHE反而比使用CACHE还快。原因是搬到CACHE中的数据必须得到多次重复使用才会提高系统效率。所以在通信系统中一般只打开指令CACHE,数据CACHE即使打开也只局限在部分存储空间,如堆栈部分。同时也要求程序设计要兼顾CACHE的容量及块大小,这涉及到关键代码循环体的长度及跳转范围,如果一个循环刚好比CACHE大那么一点点,又在反复循环的话,那就惨了。 SDc*eOU<|| ( ~( Z e1 E) f) V, X' i4 b+ f
I gz0XBu , E- S8 ]- S( |" K% r
$]?*f?m 1 l5 }$ R' K! q" o3 y4 W( T
R))7#y]
% J! {7 K1 P+ G; V现象十:存储器接口的时序都是厂家默认的配置,不用修改的 |-%K %q[_F
( X$ _1 i L% w& ]. `- P5 YIU<>w$m / `$ |8 W9 O2 o5 I! k; B5 C! y
点评:BSP对存储器接口设置的默认值都是按最保守的参数设置的,在实际应用中应结合总线工作频率和等待周期等参数进行合理调配。有时把频率降低反而可提高效率,如RAM的存取周期是70ns,总线频率为40M时,设3个周期的存取时间,即75ns即可;若总线频率为50M时,必须设为4个周期,实际存取时间却放慢到了80ns。 <>-o}Zr5o
; t- M+ @. n* z" R6 i1 y+ c; eb^KGv
G( C; M+ q6 Q+ B, _6 cMJinr*e<
- `. M, s; g9 D# i2 w2 X4 D"~A9z8{F
- J9 R& X/ j d. ?; s3 b7 u3 t1 ~现象十一:这个CPU带有DMA模块,用它来搬数据肯定快 ib)d"C1E# 5 Y+ d0 J" l" U0 ]# V* O x2 h# {
&$Al p[Cfv
$ p' Y" D4 B8 D3 l" ]5 e& V% h6 }( Y: f点评:真正的DMA是由硬件抢占总线后同时启动两端设备,在一个周期内这边读,那边写。但很多嵌入CPU内的DMA只是模拟而已,启动每一次DMA之前要做不少准备工作(设起始地址和长度等),在传输时往往是先读到芯片内暂存,然后再写出去,即搬一次数据需两个时钟周期,比软件来搬要快一些(不需要取指令,没有循环跳转等额外工作),但如果一次只搬几个字节,还要做一堆准备工作,一般还涉及函数调用,效率并不高。所以这种DMA只对大数据块才适用。 ZKR!s}T" + A' X8 L% e. R8 _+ D+ R; r( O
k5WTY49~ 1 r4 f+ K {" P2 }3 n( T
JF9{Gy+ : F6 @' t% c, J* X
.Rl1q> 5 |* E/ |0 z4 L6 y6 e
现象十二:100M的数据总线应该算高频信号,至于这个时钟信号频率才8K,问题不大。 =g"z}K
: e: i, ?3 o! t; i; N( n, ~]A(2?O| VM ; c& P& A9 T/ s3 I( k1 X3 O8 j9 M
点评:数据总线的值一般是由控制信号或时钟信号的某个边沿来采样的,只要针对这个边沿保持足够的建立时间和保持时间即可,此范围之外有干扰也罢过冲也罢都不会有多大影响(当然过冲最好不要超过芯片所能承受的最大电压值),但时钟信号不管频率多低(其实频谱范围是很宽的),它的边沿才是关键的,必须保证其单调性,并且跳变时间需在一定范围内。 bvax8vt5
# `: S: v9 {& i8 g, ]9 gj9WMMb58 & _% ~) A5 D* S2 D% Y6 d
bTb(Up
T9 p# G: ]$ r' X7 u0 L$ i2 R# Qg!2s{*BL\D
% B- ?5 D: e, K( }( G现象十三:既然是数字信号,边沿当然是越陡越好 ${ZU=)
# v3 a s8 }: T& A5 A6 G# _%?@DJ1*
( O9 V; k4 W% l1 F, B4 K: P点评:边沿越陡,其频谱范围就越宽,高频部分的能量就越大;频率越高的信号就越容易辐射(如微波电台可做成手机,而长波电台很多国家都做不出来),也就越容易干扰别的信号,而自身在导线上的传输质量却变得越差,因此能用低速芯片的尽量使用低速芯片。 2[U(sIO;
- ]7 I; a4 j3 ^2 o& wz pf,&D
$ m& O9 K9 h* b* f& a0 x/ v' e3 owhlmD!-/ ( ^( Y! \: X- M) }- G' K' D3 N
}wvLcv
3 `2 ~# j! W5 t1 W N+ H2 s' e现象十四:信号匹配真麻烦,如何才能匹配好呢? '.| ;zp4 9 r K, S& C$ j
cHFS\,`:
1 C. f) q4 K6 C# q3 N2 M1 [点评:总的原则是当信号在导线上的传输时间超过其跳变时间时,信号的反射问题才显得重要。信号产生反射的原因是线路阻抗的不均匀造成的,匹配的目的就是为了使驱动端、负载端及传输线的阻抗变得接近,但能否匹配得好,与信号线在PCB上的拓扑结构也有很大关系,传输线上的一条分支、一个过孔、一个拐角、一个接插件、不同位置与地线距离的改变等都将使阻抗产生变化,而且这些因素将使反射波形变得异常复杂,很难匹配,因此高速信号仅使用点到点的方式,尽可能地减少过孔、拐角等问题。 |
评分
-
查看全部评分
|