

# Análise de estruturas e parâmetros das técnicas de mitigação de falhas causadas pela radiação espacial em dispositivos COTS

## BARBOSA, A. L.<sup>1</sup>, LOUREIRO, G.<sup>2</sup>, MANEA, S.<sup>3</sup>,

## DUARTE, J. M. L.<sup>4</sup>, GIULIANI, G. P.<sup>5</sup>

<sup>1</sup>Instituto Nacional de Pesquisas Espaciais, São José dos Campos, SP, Brasil

Doutorando em Engenharia e Gerenciamento de Sistemas Espaciais - CSE

<sup>2</sup>Laboratório de Integração e Testes (LIT), Instituto Nacional de Pesquisas Espaciais, São José dos Campos, SP, Brasil

<sup>3</sup>Projeto CITAR (Circuitos Integrados Tolerantes à Radiação), Instituto Nacional de Pesquisas Espaciais, São José dos Campos, SP, Brasil

<sup>4</sup>Centro Regional do Nordeste (CRN), Instituto Nacional de Pesquisas Espaciais,

Natal, RN, Brasil

<sup>4</sup> Centro Regional do Nordeste (CRN), Instituto Nacional de Pesquisas Espaciais,

Natal, RN, Brasil

eng.adilsonlb@gmail.com

**Resumo.** Os dispositivos COTS (Commercial off-the-shelf) passaram a ser utilizados com maior ênfase na área espacial, principalmente pelos aspectos de aquisição e de custos, porém apresentam vários benefícios tecnológicos. Agências espaciais internacionais ressaltam a necessidade destes componentes para o futuro das missões espaciais, com ênfase em nanossatélites. Devido ao ambiente hostil do espaço, estes necessitam de técnicas de mitigação para os efeitos da radiação. O principal objetivo do artigo é analisar estruturas e parâmetros envolvidos na seleção destas técnicas de mitigação. A metodologia consiste em uma ampla pesquisa bibliográfica exploratória, ressaltando os quatro exemplos mais relevantes para o tema em estudo. Os trabalhos científicos publicados demonstram várias estruturas que se propõem a auxiliar o engenheiro de componentes, mas elas contêm resultados parciais. As análises e propostas de aperfeiçoamento devem conduzir a uma metodologia posterior que seja uma melhor referência para a seleção das técnicas de mitigação, segundo os autores.

Palavras-chave: COTS; Falhas; Mitigação; Radiação; Técnicas.



7 a 9 de agosto de 2019

## 1. Introdução

Os dispositivos COTS (*Commercial off-the-shelf*) passaram a ser utilizados com maior ênfase nos projetos espaciais, principalmente pelos aspectos de aquisição e de custos. Estes dispositivos podem ser definidos como componentes eletrônicos comerciais prontamente disponíveis e não fabricados, inspecionados ou testados de acordo com padrões espaciais. Sinteticamente, os COTS não são fabricados para operação no espaço e devem possuir uma solução de mitigação para garantir a sua operacionalidade nos ambientes de radiação espacial (MOUSAVI et al., 2018; ESA, 2012).

A Agência Espacial Européia (ESA - *European Space Agency*) ressalta a necessidade do alto desempenho dos circuitos de processamentos digitais e suas plataformas, de uso geral para o futuro das missões espaciais baseadas em COTS. Em alguns programas uma das principais motivações para usar processadores, com componentes eletrônicos mais elaborados, é a possibilidade de implementar sistemas tolerantes a falhas com componentes COTS. Um dos exemplos é o FPGA (*Field Programmable Gate Array*) COTS, o qual se destaca como uma alternativa para computação de desempenho avançado, apresentando principalmente capacidade elevada de processamento, flexibilidade, baixo consumo de energia e baixo custo, quando comparados com tecnologias convencionais de circuitos digitais. (MEDEIROS, 2013; MOUSAVI et al., 2018; VILLA et al., 2018).

Apesar das vantagens mencionadas para a utilização de COTS, os projetos espaciais estão sujeitos ao ambiente hostil do espaço que provoca efeitos adversos nos componentes eletrônicos, sendo um dos problemas mais relevantes a dose de radiação espacial, que pode causar danos em componentes eletrônicos, células solares e materiais. Os sistemas espaciais exigem componentes com qualificação espacial, "endurecidos" contra radiação, e que apresentem uma alta taxa de processamento em relação aos componentes convencionais. Porém, o processo de fabricação dos componentes resistentes à radiação pode torná-los muito mais caros que os COTS (MEDEIROS, 2013; PINHO et al., 2016; VILLA et al., 2018).

Também há a possibilidade de embargos tecnológicos, pois a área espacial abrange projetos reservados, ou seja, relacionados aos aspectos militares e de defesa dos diversos países. Assim, considerando o fato dos embargos, efeitos da radiação e os elevados custos dos componentes resistentes à radiação, os COTS podem ser considerados dispositivos viáveis tanto pelo aspecto tecnológico, quanto comercial e estratégico. Porém, estes necessitam passar por um processo de mitigação dos efeitos da radiação, que podem estar relacionados com os aspectos de *hardware* e *software* (MEDEIROS, 2013; OECD, 2014; VILLA et al., 2018).

Os principais tipos de efeitos da radiação espacial para os componentes eletrônicos COTS são apresentados na Tabela 1, conforme ESA (2008) e Manea (2018). Algumas das técnicas de mitigação pesquisadas foram: circuitos de proteção (REYNERI et al., 2010), *careful* COTS (SINCLAIR e DAYER, 2013), redundância e reconfiguração (PAROBECK, 2013), códigos de detecção e correção de erros (SHIRVANI et al., 2000) e duplicação (KASTENSMIDT et al., 2004). Muitos trabalhos científicos relacionados ao assunto foram publicados, apresentando diversos procedimentos com alguns tipos de técnicas de mitigação. Porém, constata-se que as estruturas e os parâmetros utilizados são parciais e não atingem totalmente o objetivo de auxiliar o engenheiro de componentes na importante tarefa de realizar a seleção da melhor técnica de mitigação de acordo com a aplicação e missão.



Tabela 1 – Principais tipos de efeitos da radiação espacial. [Fonte: ESA (2008) e Manea (2018)]

| Tipo de efeito                                                          | Características                                                                                                                                                                                                                                                     | Ocorrência                                                                                                                                                                                                                         |
|-------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| Dose Total de<br>Ionização (TID- <i>Total</i><br><i>Ionizing Dose</i> ) | Degradação acumulada que<br>resulta em falha no subsistema<br>ou sistema, ou anomalias mais<br>graves do sistema.                                                                                                                                                   | Degradação da microeletrônica como<br>mudança de tensão de limiar e correntes de<br>fuga em CMOS ( <i>Complementary Metal-Oxide-Semiconductor</i> ) e circuito linear<br>bipolar (considerando a sensibilidade à taxa<br>da dose). |
| Danos de<br>Deslocamento (DD -<br>Displacement<br>Damage)               | Os átomos são deslocados de<br>suas posições originais, podendo<br>alterar as propriedades elétricas,<br>mecânicas ou ópticas dos<br>materiais.                                                                                                                     | Danos relevantes para componentes eletro-<br>ópticos (por exemplo, células solares e<br>optoacopladores) e para detectores.                                                                                                        |
| Efeitos de Evento<br>único (SEE - Single<br>Event Effects).             | Conjunto de fenômenos em que<br>a microelectrónica pode ser<br>interrompida ou<br>permanentemente danificada por<br>partículas de incidência única;<br>ocorrem por ionização direta de<br>regiões sensíveis dos<br>semicondutores (geração de<br>carga localizada). | Danos em elementos de memória,<br>detectores em missões de astronomia e<br>observação, aumento de carga estática em<br>materiais dielétricos internos, corrupção de<br>dados, ruídos em imagens e desligamento<br>de sistemas.     |

Neste artigo serão mencionados quatro exemplos das estruturas consideradas mais importantes para o tema, segundo os autores, com seus respectivos parâmetros. O principal objetivo do artigo é analisar estruturas envolvidas na seleção das técnicas de mitigação dos efeitos da radiação, em relação aos seguintes aspectos: organização, parâmetros e técnicas utilizadas. Também considera a abrangência destas técnicas, que está relacionada ao enfoque do maior número possível das mesmas, com embasamento em trabalhos científicos anteriores. Também serão realizadas novas propostas de abordagem para que seja confeccionada uma única metodologia que seja suficiente para auxiliar de forma relevante o engenheiro de componentes.

#### 2. Metodologia

Para avaliar as estruturas e parâmetros relativos às técnicas de mitigação das falhas, foi realizada uma ampla pesquisa bibliográfica exploratória, segundo Prodanov e Freitas (2013), sobre os diversos tipos de estruturas como *flowcharge, decision flow, , decision tree, top-level hierarchy, framework, state machine* e outras que pudessem permitir a melhor compreensão do processo de seleção. Foram utilizados alguns critérios para a escolha de quatro estruturas que, segundo os autores, refletem melhor como estas são confeccionadas e qual a sua relevância no contexto geral. Destas estruturas, duas apresentaram estudos de caso com nanossatélites, ressaltando a importância dos COTS para esta tecnologia. Também foram pesquisados os diversos tipos de técnicas de mitigação nos últimos dezenove anos em trabalhos de pós-graduação e periódicos acadêmicos especializados em tecnologia espacial,



eletrônica, telecomunicações e informática. A análise foi realizada considerando os aspectos relacionados ao formato da estrutura, os parâmetros e técnicas de seleção utilizados, incluindo comparações com outras estruturas de componentes específicos.

### 3. Resultados e Discussão

Conforme exposto anteriormente, neste item serão analisadas quatro estruturas pesquisadas em trabalhos científicos anteriores sobre o tema. A primeira refere-se a um *top-level hierarchy* para componentes COTS, segundo Austin et al. (2017), que demonstra como os principais tipos de efeitos da radiação para os circuitos podem ser abordados conjuntamente, representando um exemplo dificilmente constatado na literatura. Refere-se a um artigo baseado em *Reliability & Maintainability* (R&M) da NASA (*National Aeronautics and Space Administration*), que utiliza como estudo de caso um nanossatélite. Neste caso, a abordagem para mitigar os efeitos da radiação é expresso usando notação de estrutura em metas (GSN - *Goal Structuring Notation*), onde são analisados dois tipos de efeitos da radiação para semicondutores: TID e SEE.

Objetivos (goals), estratégias (strategies) e soluções (solucions) compõem a base da estrutura do GSN, culminando com elementos de solução: testes de peças, testes de sistema, simulações e análises, revisão de literatura, e outros. O estudo de caso deve operar dentro de um determinado ambiente, com o caminho inicial considerando um elemento de contexto (*context*), que fornece informações sobre como um objetivo ou estratégia devem ser interpretados. Verifica-se que estas estruturas de top-level hierarchy são bem apropriadas para estabelecer as bases para uma análse de nível maior, mais conceitual, onde podem ser definidos principalmente os objetivos e estratégias. Quanto às técnicas de mitigação, o estudo de caso menciona somente circuito de proteção e *careful* COTS no texto do artigo. A Figura 1 apresenta a parte relativa a TID, já que os procedimentos relativos a SEE são mais explorados na literatura e podem ser representados em outro exemplo (AUSTIN et al., 2017).

O segundo caso refere-se a uma *decision tree* relativa a componentes eletrônicos COTS, conforme Machado (2014), com enfoque em SEE e embasamento em norma da NASA. Este estudo ressalta a determinação da criticalidade, ou seja, o impacto de um SEE nas funções executadas por um dispositivo (nível operacional). As classes de criticalidade representam as diferentes gravidades da ocorrência de SEE e, após esta análise, é possível determinar se as necessidades de tolerância e os esquemas de mitigação são adequados para proteger o sistema dos impactos. Nesta *decision tree*, há um índice de criticalidade para as funções executadas pelos sistemas com três grupos: *error functional* (alta probabilidade de SEEs pode ser aceita), *error vulnerable* (baixa probabilidade de SEEs pode ser aceita) e *error critical* (funções não podem ser afetadas por SEEs). Sob o aspecto de estrutura, esta *decision tree* é mais próxima de um processo de seleção de técnicas, pois apresenta possibilidade de decisões, baseada em um parâmetro bem definido de criticalidade. Também menciona algumas possibilidades de técnicas de mitigação de falhas como detecção e correção de erros, redundância e métodos de votação (subtipo de redundância). Apesar desta estrutura ser mais operacinal, é bem específica para o parâmetro de criticalidade.



#### X Workshop em Engenharia e Tecnologia Espaciais

7 a 9 de agosto de 2019



Figura 1 - Exemplo de top-level hierarchy (TID). [Fonte: Adaptado de Austin et al., 2017]

A Figura 2 apresenta a *decision tree* para análise de criticalidade, descrevendo uma estrutura representativa e níveis de risco ou requisitos de tolerância correspondentes. Outras duas estruturas foram abordadas em artigo publicado sobre o tema, segundo Barbosa et al. (2018), considerando o exemplo de componentes eletrônicos digitais, os FPGAs COTS. Devido às várias vantagens tecnológicas e de aquisição, estes podem ser considerados como uma tendência de aplicações em missões espaciais, principalmente de nanossatélites.

Assim, este terceiro trabalho considerado apresenta os principais tipos de efeitos da radiação (SEE/TID), porém a estrutura (*decision flow*) é baseada em SEEs que atuam em FPGAs COTS. São abordadas algumas técnicas de tolerância a falhas, relacionadas com redundância, reconfiguração e duplicação. O principal parâmetro utilizado para critério de seleção é o espaço físico disponível no mesmo FPGA ou com a utilização de mais de um FPGA. Como o segundo exemplo (*decision tree*) esta estrutura é operacional, porém o parâmetro é bem específico (SIEGLE et al., 2015; BARBOSA et al., 2018).

O quarto exemplo de estrutura (*flowchart*) também relativo a FPGA COTS, menciona os principais tipos de efeitos da radiação (SEE/TID), com ênfase em TID. O estudo de caso (nanossatélite) aborda algumas técnicas de tolerância a falhas, principalmente relacionadas a redundância, códigos de detecção e correção de erros e reconfiguração. O referido *flowchart* apresenta detalhamento maior sobre a utilização de métricas e uma metodologia de seleção (Pareto-ótimo). No desenvolvimento do artigo há cálculos específicos das métricas utilizadas para potência, confiabilidade e vida útil. A ênfase no estudo de TID caracteriza melhor a métrica relacionada com o tempo de vida útil, apresentando um estudo de caso com uma missão de nanossatélite. Apesar desta ênfase, a estrutura é a mais completa em termos de parâmetros, pois os mesmos se constituem em métricas muito bem definidas (WULF et al., 2016; BARBOSA et al., 2018).



Figura 2 - Decision tree em relação à criticalidade (SEE). [Fonte: Adaptado de Machado, 2014]

#### 4. Conclusão

Neste artigo foram analisadas duas estruturas relativas à mitigação dos efeitos da radiação em componentes eletrônicos COTS, sendo considerados exemplos relevantes para o assunto em pauta. As análises foram realizadas em relação ao formato das estruturas, os parâmetros e tipos de técnicas utilizados. As duas primeiras estruturas pesquisadas e analisadas consistiram de *top-level hierarchy* e *decision tree* para componentes eletrônicos COTS, em geral, com a notação de estrutura em metas e parâmetro de criticalidade, respectivamente. As duas estruturas são embasadas em estudos e norma da NASA e mencionam técnicas de mitigação como circuito de proteção, *careful* COTS, detecção e correção de erros, redundância e métodos de votação.

Esta análise foi comparada com análise anterior de duas outras estruturas relativas a FPGAs COTS (*decision flow e flowchart*). Nestas foram abordados os principais tipos de efeitos da radiação (SEE/TID), com ênfase em apenas um deles. As técnicas de mitigação mencionadas nos dois exemplos foram redundância e reconfiguração (ambos), duplicação (*decision flow*) e códigos de detecção e correção de erros (*flowchart*). Os principais parâmetros utilizados



7 a 9 de agosto de 2019

foram o espaço físico e disponibilidade de FPGAs, assim como métricas de potência, confiabilidade e vida útil.

Analisando as estruturas e parâmetros dos quatro exemplos mencionados, conforme objetivo do artigo, constata-se que as pesquisas geralmente abordam os efeitos de SEE e TID, mas geralmente apresentam ênfase em apenas um dos casos. Quando há os dois tipos de abordagens (apenas um exemplo) a estrutura é relativa a componentes COTS (em geral) e menos operacional. As pesquisas geralmente abordam vários tipos de técnicas de mitigação, porém as estruturas analisadas consideram aproximadamente sessenta por cento delas. Finalmente, estas estruturas apresentam parâmetros diversificados de análise como estruturação hierárquica, criticalidade, capacidade física (*hardware*) e métricas (potência, confiabilidade e tempo de vida).

Para que o engenheiro de componentes possa utilizar uma metodologia mais completa para auxiliá-lo na seleção das técnicas de mitigação dos efeitos da radiação para componentes COTS são necessários vários procedimentos, de acordo com as análises realizadas. Esta estrutura deve apresentar uma hierarquia, podendo ser composta principalmente de objetivos e estratégias. Também deve considerar a grande maioria das técnicas de mitigação disponíveis na literatura,-\_com-\_parâmetros bem definidos para orientar esta seleção, principalmente métricas que tornarão a seleção mais objetiva. Apenas alguns procedimentos propostos foram observados nas estruturas analisadas, mas trabalhos científicos posteriores poderão desenvolver uma nova metodologia que atenda a estas recomendações.

Agradecimentos: Ao INPE e Coordenadores, Professores e Colaboradores do ETE/CSE.

#### Referências

- Austin, A. R.; Mahadevan, N.; Sierawski, B. D.; Karsai, G.; Witulski, A. F. and Evans, J. (2017). A CubeSat-payload radiation-reliability assurance case using goal structuring notation. In: Annual Reliability and Maintainability Symposium (RAMS), Orlando, FL, USA. Proceedings...Orlando:2017.
- Barbosa, A. L.; Loureiro, G.; Manea, S.; Marcelo, J. M. L. e Garbi, G. P. (2018). Frameworks para seleção das técnicas de mitigação de falhas causadas pela radiação especial. In: Workshop em Engenharia e Tecnologia Espaciais (WETE), 9., São José dos Campos, SP, Brasil. Anais...São José dos Campos: INPE, 2018.
- Europe Space Agency (ESA) (2008). ECSS-E-ST-10-12C: Space engineering: methods for the calculations of radiation received and its effects, and a policy for design margins. Paris: 2008. 105 p.
- Europe Space Agency (ESA) (2012). ECSS-E-ST-00-01C: Glossary of terms. Paris: 2012. 63p.
- Kastensmidt, F. G. L.; Neuberger, G.; Hentschke, R. F.; Carro, L. and Reis, R. (2004). Design fault tolerant technique for SRAM based FPGAs. IEEE Design & Test of Computers, v. 21, n. 6, p. 552-562.
- Machado, S. R. F. (2014). Estudo de um processo de garantia da confiabilidade de sistemas eletrônicos embarcados a single event upsets causados por partículas ionizantes.192 p. Dissertação (Mestrado em Engenharia e Tecnologia Espaciais/Gerenciamento de Sistemas Espaciais) Instituto Nacional de Pesquisas Espaciais (INPE), São José dos Campos, 2014.



- Manea, S. (2018). CSE-342-4 Introduction to the space radiation effects on satellites: course organization M1-3 (2018), São José dos Campos: National Institute for Space Research. 27 slides.
- Medeiros, V. W. C. (2013). fastRTM: um ambiente integrado para desenvolvimento rápido da Migração Reversa no Tempo (RTM) em plataformas FPGA de alto desempenho. 126 p. Tese (Doutorado em Ciência da Computação) Universidade Federal do Pernambuco (UFPE), Recife, 2013.
- Mousavi, M.; Pourshaghaghi, H. R.; Tahghighi, M.; Jordans, R. and Corporaal, H. (2018). A generic methodology to compute design sensitivity to SEU in SRAM-based FPGA. In: IEEE Euromicro Conference on Digital System Design (DSD), 21., Prague, Czech Republic. Proceedings...Prague: 2018.
- Organisation for Economy Cooperation and Development (OECD) (2014). The space economy at a glance 2014. Paris: 2014. 146 p.
- Parobeck, L. S. (2013). Research, development and testing of a fault-tolerant FPGA-based sequencer for cubesat lauching applications. 192 p. Thesis (Master of science in electrical engineering) Naval Postgraduate Schoool, Monterey, 2013.
- Pinho, M.V., Kraeamer, F. e Soares, I. (2016). FPGAs em aplicações espaciais. Florianópolis: Instituto Federal de Santa Catarina. Notas de aula.
- Prodanov, C. C. e Freitas, E. C. (2013). Metodologia do trabalho científico: métodos e técnicas da pesquisa e do trabalho acadêmico. 2.ed. Novo Hamburgo: Universidade Feevale, 2013. 276 p. Disponível em: http://www.feevale.br/Comum/midias. Acesso em: 30 jul. 2019.
- Reyneri, L. M.; Sansoè, C.; Passerone, C.; Speretta, S.; Tranchero, M.; Borri, M. and Corso D. D. (2010). Design solucion for modular satellites architectures. In: Arif, T. T. Aeroespace Technologies Advancementes. London: IntechOpen. Available:< https://www.intechopen.com/books/aerospace-technologies-advancements>. Access on: 07 feb. 2019.
- Shirvani, P. P.; Saxena, N. R. and McChuskey, E. J. (2000). Software implemented EDAC protect against SEUs. IEEE Transactions on Reability, v. 49, n. 3, p. 273-284.
- Siegle, F.; Vladimirova, T.; Ilstad, J. and Eman, O. (2015). Mitigation of radiation effects in SRAM-based FPGAs for space applications (2015). ACM Computing Surveys (ACM Digital Library), v. 47, n. 2. Available:< https://dl.acm.org/citation.cfm?id=2671181>. Access on: 07 feb. 2019.

Villa, P. R. C.; Travessini, R.; Vargas, F. L. and Bezerra, E. A. (2018). Processor checkpoint recovery for transient faults in critical applications. In: Latin-American Test Symposium (LATS), 19., São Paulo, SP, Brazil. Proceedings...São Paulo: 2018.

Wulf, N., George, A. D. and Ross, A. G. (2016). A framework for evaluating and optimizing FPGA-based SoCs for aerospace computing. ACM Transactions on Reconfigurable Technology and Systems, v. 10, n. 1, p. 1-29.



Apêndice A – Exemplo de *decision flow* para *hardware* (SEE)



Figura 3 - Exemplo de decision flow para hardware (SEE). [Fonte: Barbosa et al., 2018]



Apêndice B – Exemplo de *flowchart* para a métrica de potência (TID)



Figura 4- Exemplo de f*lowchart* para a métrica de potência (TID). [Fonte: Adaptado de Barbosa et al., 2018]