Artigos

O processador chinês

Introdução

Penso que não é novidade para ninguém que a China nos últimos anos tem tido um crescimento enorme, comparado com o resto do mundo, estando a tornar-se uma super-potência que começa a influenciar não só os seus vizinhos, como o mundo inteiro, com o seu poder económico.

Um dos pontos que tem feito crescer muito a China, tem sido o enorme desenvolvimento a nível industrial, com muitas empresas externas a colocarem em terrenos chinês as suas fábricas, derivado em parte pelos baixos salários.

No entanto não é só neste sector que a China está a crescer. Praticamente em todos os sectores estão a ser feitos largos investimentos, seja só pelo governo chinês, que tem grande controlo sobre a economia, seja com parcerias com o estrangeiro.

No entanto é bem conhecido que a China quer depender cada vez menos do exterior e tenta criar produtos internamente para abastecer especialmente o aumento do consumo interno.

É verdade que muitas vezes estes produtos são cópias de produtos de empresas ocidentais, roubando propriedade intelectual e muitas vezes com fraca qualidade, mas baixos preços.

Esta situação é preocupante, mas não é nada que outros gigantes asiáticos não tenham feito, como o Japão ou a Coreia do Sul. Talvez a diferença é que a China não se preocupa em disfarçar esse facto.

Apesar de ser quase desconhecido no mercado ocidental, o mercado da informática também não está imune a esta tentativa de se libertarem de produtos externos e criarem eles próprios os seus produtos.

Um dos exemplos é a distribuição de Linux nacional com o nome de Red Flag Linux.

No entanto não é o único caso.

Loongson ou Godson ou Dragon chip…

Este artigo vai-se debruçar sobre o processador que está a ser desenvolvido na China, que não é conhecido apenas por um nome, mas sim por estes três. Para facilitar, vou daqui para a frente chamar Loongson, que é o nome original, mas qualquer um destes três nomes se refere ao mesmo processador.

Ao contrário do que possam pensar, este processador não é propriamente uma novidade. Foi dado a conhecer ao publico em geral em 2002, mas as ideias já vinham de trás.

O processador começou a ser desenvolvido pela ICT (Institute of Computing Technology), que é um instituto do estado chinês, mas em 2002 decidiu-se criar uma parceria com capitais públicos e privados entre este instituto e um grupo com o nome de Jiangsu Zhongyi Group.

Desta pareceria, criou-se a empresa BLX, sediada em Pequim, que tem como objectivo desenvolver este processador.

A empresa é “fabless”. Isto é, não tem fábricas próprias. Apenas criam o design. O seu fabrico está entregue à ST Microelectronics.

O que é o Loongson e o seu passado

Como dei a entender na introdução, a arquitectura deste processador não foi criada de raiz, mas foi sim criado a partir de uma base MIPS.

No entanto para evitarem pagar licenças à MIPS Technologies, detentora dos direitos da arquitectura, a empresa chinesa que desenvolveu a primeira versão deste processador, retirou 4 instruções e oficialmente anunciou que era uma arquitectura feita de raiz.

Ora esta atitude não caiu bem nem na empresa que tem os direitos da arquitectura MIPS, nem para o governo dos Estados Unidos, mas durante anos a China simplesmente ignorou este facto.

Só em 2007 é que a empresa BLX entrou em acordo com a MIPS Technologies para os processadores serem reconhecidos como compatíveis com Mips. No entanto só em 2009 é que a BLX pagou os direitos da arquitectura MIPS32 e MIPS64. Pelo menos parece que o assunto a nível legal ficou resolvido.

A questão seguinte é, o que é MIPS? MIPS é uma arquitectura RISC criada em 1981 pela SGI, para ser incorporado nos seus produtos de workstations, servidores e super computadores.

SGI Octane 2, uma workstation da SGI que tem como uma das marcas o seu design futurista. Este computador é de 1995.

Até ao fim dos anos 90 do século passado, esta arquitectura bateu-se principalmente no mercado de alta gama com outras arquitecturas, como PowerPC, PA-RISC, Alpha, etc. Estes produtos estavam normalmente ligados a sistemas operativos Unix, proprietários de cada marca. No caso da SGI, o IRIX.

Em 1990 a SGI começou a licenciar a arquitectura MIPS a terceiros, com algum sucesso e em 1999 a SGI decidiu criar uma empresa completamente independente que tratasse só do licenciamento e protecção desta arquitectura, a já falada MIPS Technologies.

Não me quero estender sobre o que aconteceu à SGI e à arquitectura MIPS, mas fica aqui um resumo.

Em relação à SGI, aconteceram 3 eventos importantes que quase iam matando uma das empresas que já tinha sido um gigante da industria. O primeiro factor foi o aparecimento e desenvolvimento do Linux, que é parecido com Unix, no entanto não é proprietário nem estava fragmentado como acontecia com o Unix. O segundo factor foi a arquitectura x86 ter começado a invadir este segmento mais alto de mercado, quando anteriormente era uma arquitectura que não tinha performance e estrutura para escalar e combater estes processadores como o MIPS. Por último e também muito importante, foi o aparecimento de placas 3D no mercado consumidor, que por ter um volume de vendas maior, eram dezenas de vezes mais baratas que as soluções da SGI e muitas vezes com melhor performance.

Diga-se que hoje em dia a SGI continua a existir, mas num tamanho mais reduzido e concentrada no mercado HPC (High Performance Computing), com soluções x86 e aceleradores com Gpus de terceiros.

A MIPS Technologies seguiu o seu caminho, licenciando a arquitectura MIPS especialmente para o mercado Embedded. Alguns dos produtores de chips MIPS são a ATI, a Infinion, a NEC e a Toshiba. Existem outras marcas, mas menos conhecidas.

Talvez o produto recente, mais conhecido, a usar um processador MIPS, seja a Sony Playstation 2.

No entanto com o passar do tempo, a MIPS tem perdido algum terreno para outras arquitecturas, especialmente para ARM e PowerPC.

Mas voltando ao processador chinês Loongson.

Até aos dias de hoje tivemos 3 gerações deste processador.

Loongson 1

A primeira versão deste processador podemos quase considerar como um teste. Saiu em 2002. Usava a versão MIPS32 (32 bit), entre 200 a 266 Mhz, 16 Kbytes de L1 cache, não tinha cache L2, fabricado a 180 nm, 1 core e consumia apenas 1W.

Este processador estava apontado para sistemas embedded, porque é fácil de perceber pelas especificações, que mesmo em 2002, era um processador sem grande poder computacional.

É possível ter sido usado em algum dispositivo, mas não há informações sobre esse matéria.

Loongson 2

Pouco depois da introdução da primeira versão, em 2003, foi introduzido a segunda versão deste processador.

Tendo em conta esta pequena diferença de tempo, houve muitas mudanças.

Primeiro que tudo é uma família de processadores que já teve 4 versões. 2B, 2C, 2E, 2F e há planos para continuar a evoluir o Loongson 2 no futuro (apesar de passar a usar MIPS64 em futuras versões).

A primeira diferença é que a arquitectura é baseada em MIPS III. É out-of-order, 4-way superscalar, 2 ALUs, 2 FPUs, 1 AGU, controlador de memória DDR2 integrado no processador, acelerador gráfico no processador, apenas 1 core, power managment por software e consumo de 4W a 1Ghz.

Como disse já houve quatro evoluções desde 2003 a 2007 e foram sempre melhoradas as especificações, começou por ser produzido a 180 nm e acabou nos 90 nm. Foi dos 250 mhz até aos 1.2 Ghz. 64 KB para 128 KB de L1 e não tendo cache L2 até ter sido adicionado 512 KB de L2.

Apesar de não serem as especificações mais “incríveis” do mundo, algumas empresas chinesas começaram a criar computadores para o utilizador final, baseado neste processador.

Um exemplo é o Municator, criado por uma empresa sediada em Macau e que criou um pequeno computador com um preço de 150 dólares.

Fica aqui um vídeo sobre ele:

No entanto não foi este o maior sucesso comercial deste produto. O maior sucesso foi a criação de uma empresa que se dedica a criar computadores apenas baseados neste processador. Essa empresa é a Lemote.

Neste momento eles têm 3 produtos:

Um Mini-PC bastante pequeno.

Um netbook, que é ideal num processador que consome tão pouco.

Por fim um All-in-one PC, que é bastante elegante.

De referir que a província de Jiangsu, na China, comprou 150 mil computadores com este processador.

Além disso, apareceram também algumas motherboards com este processador:

Ainda não falei de software, mas como dá para perceber, o Windows não vai correr neste processador. Apesar de haver várias distribuições de Linux que suportam MIPS, normalmente é usado algo baseado em Debian.

No entanto, em 2010 foi feito um port do Windows CE e do Android para este processador, o que dá mais opções de escolha.

Loongson 3

Nesta terceira geração, começamos a falar em algo bem mais avançado.

Esta terceira geração foi anunciada em 2009 e é baseada em MIPS64 (64 bit), tem 4 cores, 1 Ghz, 65 nm, 425 milhões de transístores, 128 KB de cache L1 por core e 4 MB de cache L2 partilhada. No total, o processador com os 4 cores, consomes 10W.

Além disto há algo muito interessante. Foram adicionadas 200 instruções que ajudam à emulação de código x86. Isto é, usando qemu em Linux, além de ser possível correr código x86, estas instruções aceleram o processo. Isto só aumentou em 5% o die size do processador e a nível de performance, perde apenas em média 30% do que estar a correr num processador nativo x86.

Apesar de este processador poder ser usado em portáteis, o primeiro alvo foram os desktops e principalmente servidores.

Este processador já está a ser usado em alguns datacenters na China, para servidores, mas isto ainda é apenas o ínicio, como vão ver depois.

Mostro aqui duas motherboards com o Loongson 3:

Primeiro a versão Desktop, que como podem ver tem um aspecto mais moderno. Tem um controlador de memória DDR3 integrado no processador, com 4 Dimms. Usa o chipset AMD 780E, com a ATI 3200 como gpu integrado e southbridge SB710. 2 slots Pci, 2 Pci-Express 1x, 1 Pci-Express 16x, 6 Sata II, Entradas Usb, ethernet, vga, dvi e ps/2.

Esta motherboard não é muito diferente da anterior, mas é virada para servidores, mas tem 3 slots Pci-Express 8x, usa DDR2 e bastante interessante, usa Hypertransport como bus, licenciado da AMD. Com dois processadores, temos 8 cores no total.

Futuro

Como devem ter percebido, com as várias gerações deste processador, tornou-se cada vez mais interessante.

Estiveram na ISSCC 2011 e pelo que foi demonstrado, não vão ficar parados no tempo.

Primeiro, alguns dados.

Vão ser investidos entre 5 a 10 mil milhões de dólares para desenvolver este processador.

O governo chinês vai encomendar 1 milhão e meio de computadores baseados no Loongson e nos últimos anos.

Este mesmo governo tem apostado nos super computadores, especialmente usando processamento de gráficas e conseguiram ter o mais rápido e o terceiro mais rápido computadores do mundo. O interessante é que o próximo super computador vai usar unicamente este processador.

Mas voltando um pouco atrás, eles estiveram na ISSCC 2011 e apresentaram a versão 3B deste processador, o roadmap para os próximos anos e blades e servidores.

A maior notícia é a versão 3B do Loongson.

Die do Loongson 3B

Esta versão duplica o número de cores da versão 3A, sendo que agora tem 8 cores.

O que não muda é o processo de fabrico, que se mantém nos 65 nm e a nível de clock, que continua a 1 GHz.

Mas há bastantes novidades. Tem dois links Hypertransport, dois controladores de memória e mais importante, cada core “ganhou” dois co-processadores vectoriais de 256-Bit. Isto faz com que a versão 3A tem um poder computacional de 16 Gflops e salta na versão 3B para 128 Gflops, do que não ser em precisão dupla.

Esta unidade adiciona 300 instruções SIMD.

O consumo passa de 10W para 40W. 128 Gflops, comparado com as últimas placas gráficas, não é impressionante, mas tendo em conta o consumo, não é mau.

Em relação ao roadmap:

O roadmap parece-me muito interessante, por vários motivos.

Primeiro, porque vão atacar três mercados com três processadores diferentes.

Para high performance computing, teremos a versão 3C, com versão com 8 e 16 cores, migração para 28 nm, 1.5 a 2 Ghz e 512 Gflops de performance.

Para PCs, será lançado a versão 2H, que na verdade não é uma continuação da arquitectura Loongson 2, mas sim uma versão “cortada” e com mais integração do 3C. Terá 1 MB de L2 e integração de Gpu, Northbridge, Southbridge e acelerador multimédia. 4 Gflops de performance em virgula flutuante.

Por último, teremos uma versão para dispositivos embedded, continuando a ser MIPS32, 300 mhz e inicialmente com o processo de fabrico a 130 nm, o que é bastante antigo. Depois será migrado para 65 nm e passa a correr a 600 mhz.

Em relação ao próximo super computador chinês, terá o nome de Dawning 6000.

Este super computador terá 3000 Longson 3B e uma performance de 300 Tflops, que não chega perto dos maiores super computadores, mas não deixa de ser um super computador com boa performance.

Blade a ser usado no super computador Dawning 6000.

Chassis que vai ser usado para colocar as Blades.

Como podem ver, cada blade tem dois processadores e 4 Dimms por processador. Na minha opinião, parece-me que haveria mais espaço para mais processadores ou Dimms, mas é o que foi projectado.

No entanto, não é neste blade que conseguiram uma maior concentração de componentes.

Servidor 1U com 16 Loongson 3B.

Bastante interessante é este servidor 1U, onde conseguiram colocar 16 processadores Loongson 3B. Isto é 128 cores, apenas no espaço de 1U, o que me parece formidável.

Penso que esta solução seria muito interessante para muitas empresas, pois apesar de não ser um core tão forte como os cores x86, a quantidade de cores em tão pouco espaço é algo de muito importante.

Por último, porque é apenas um rumor, fala-se que o governo chinês está interessado em comprar 20% da MIPS technologies, que é quem tem os direitos sobre esta arquitectura.

Conclusão

Algo que reparei, desde que conheço este processador e ao escrever este artigo é que este processador é completamente ignorado fora da China. A nível comercial existem poucas empresas fora da China que vendam ou importem produtos com este processador e a nível de cobertura jornalística, também é quase zero, apesar de ele existir desde 2002.

Não sei se é intenção da China exportar este processador para fora das suas fronteiras ou apenas “alimentar” a necessidade crescente que existe dentro do seu país.
Penso que é bastante complicado manter a longo prazo uma arquitectura, tendo apenas como alvo um país, por maior que ele seja, pois estará sempre dependente de outros produtos feitos dentro da China. Se tentarem uma globalização do processador, podem ganhar contratos com OEMs e maior suporte a nível de software.
No entanto, sendo a China, há sempre a parte politica envolvida e não sei se países ocidentais, especialmente os Estados Unidos, vão aceitar a intromissão no seu mercado de uma tecnologia de ponta vinda da China.

Olhando para a história do processador, podemos ver que apesar das limitações, ele evoluiu muito desde 2002. A primeira versão pouco ou nenhum significado teve. No entanto este 3B e futuros 3C e 2H parecem-me processadores muito mais evoluídos e a ter em conta.
Não sei se alguma vez esta empresa chinesa vai conseguir bater-se com a Intel, AMD e processadores ARM e PowerPC, no entanto os valores de investimento são bastante interessantes e o roadmap mostra que vão continuar a evoluir. Quem sabe, um dia, este processador deixe de ser um desconhecido e passe a ser mais uma opção no mercado.

Sei que nem sempre as comparações com o mercado automóvel são acertadas, mas no inicio, os carros japoneses eram baseados ou copiados de carros ocidentais, com fraca qualidade, o que levou o mercado a não os levar a sério. Com o passar dos anos, invadiram o mundo. Com os carros sul coreanos aconteceu o mesmo e com os carros chineses está na fase da cópia ou base em carros ocidentais, em que muitas vezes, pela sua fraca qualidade, são motivo de chacota.
Com este processador, não me parece muito diferente. Foi copiado de uma arquitectura já existente e as primeiras versões não são muito interessantes. No entanto, com o passar dos anos, parece-me que têm evoluído muito e já não se pode rir com a performance que eles têm.

A meu ver e até agora, parece-me que o ponto mais fraco é o processo de fabrico. Quem lhes fabrica os processadores é uma empresa externa, que apesar de não ter detalhes, é um gigante dentro da área e que deve ter melhores processos de fabrico.
Parece-me que o actual processo de fabrico a 65 nm e 130 nm não é o mais adequado, mas também penso que terá sido decidido estar uns passos atrás no processo de fabrico, por uma questão de custos, até porque não devem ter o mesmo nível de encomendas que uma AMD ou nVidia e por isso não devem conseguir reduzir o custo com uma economia de escala.
Seja como for, está prevista a redução para 28 nm e parece-me que é uma oportunidade para melhorar ainda mais os seus produtos a nível de processamento, consumo e custo.

Por fim, dizer apenas que o mundo é dominado especialmente por empresas norte americanas e japonesas a nível de design de chips, mas é bom ver um país com as potencialidades da China, apostar também nesta área e não limitar-se apenas a produzir estes produtos para terceiros.

Artigos Relacionados

Botão Voltar ao Topo