<html>
<head>
<style>
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Verdana
}
</style>
</head>
<body class='hmmessage'>
<br>On a sidebar you see the same concept in processors for use in satellites or <br>other rad-hard application, anywhere where alpha particles are likely to<br>flip a register in the hardware.<br>The common design technique is Triple-Mode Redundancy (TMR) i.e.<br>replicating the circuit three times, rule-of-three-voting etc.<br>(Read the legal disclaimers on what applications Xilinx FPGA chips<br>(which use CMOS memory for configuration) cannot be certified for if you<br>want a good laugh... that's why those applications use antifuse instead)<br><br>As for memory in enterprise computing, you always use ECC protection on it.<br><br>Another amusing story from hardware certification was that in occasional cases<br>the actual semiconductor package of a chip (such as packages containing lead)<br>contained trace heavy metals which themselves produced a non-negligible level<br>of alpha-particle radiation (possibly higher than background radiation, due to <br>proximity), and that was hard to certify. (But sometimes you're stuck with<br>using lead for its superior thermal conductivity)<br><br>Stephen<br><br>&gt; Date: Mon, 16 Mar 2009 23:59:14 -0700<br>&gt; From: jjinux@gmail.com<br>&gt; To: charles.merriam@gmail.com<br>&gt; CC: Baypiggies@python.org<br>&gt; Subject: Re: [Baypiggies] Silent data corruption paper...<br>&gt; <br>&gt; On Mon, Mar 16, 2009 at 11:09 PM, Charles Merriam<br>&gt; &lt;charles.merriam@gmail.com&gt; wrote:<br>&gt; &gt; I owed this to someone at the last meeting:<br>&gt; &gt; http://fuji.web.cern.ch/fuji/talk/2007/kelemen-2007-C5-Silent_Corruptions.pdf<br>&gt; &gt;<br>&gt; &gt; Highlights: &nbsp; Desktop disks get a random silent corruption 10x more<br>&gt; &gt; than enterprise hard drives. &nbsp;Everyone gets them occasionally. &nbsp;Figure<br>&gt; &gt; a bit gets switched every couple of months in a data center, even with<br>&gt; &gt; all the backups, checksums, etc.<br>&gt; <br>&gt; I remember hearing that Google operated at such a large scale that<br>&gt; these sorts of things tended to catch up with them.  Their approach<br>&gt; was to use more redundancy.<br>&gt; <br>&gt; I'm regurgitating things I've heard.<br>&gt; <br>&gt; -jj<br><br /><hr />Windows Live™: Keep your life in sync.  <a href='http://windowslive.com/explore?ocid=TXT_TAGLM_WL_allup_1b_explore_032009' target='_new'>Check it out.</a></body>
</html>