Elbrus 8 ja mitä seuraavaksi. venäläiset prosessorit

Venäläinen prosessori Elbrus-8S

Hyvää iltapäivää rakkaat lukijat. Tämän päivän aihe on erittäin mielenkiintoinen innokkaille patriooteille. Mene Venäjälle!!! Ja tänään puhumme venäläisistä prosessoreista " Elbrus"ja" Baikal" On sääli, että artikkelia ei todellakaan voi kutsua " venäläiset prosessorit", koska itse asiassa niitä tuotetaan Itä-Aasiassa (kuten suurin osa maailman johtavasta elektroniikasta), eikä Venäjällä. Mutta voimme olla ylpeitä siitä, että Venäjä on yksi harvoista maista maailmassa, joka pystyy kehittämään omia mikroprosessorejaan, sillä niiden takana on tulevaisuus.

Onko joukossasi niitä, jotka kirjoittavat artikkelia etsiäkseen lauseen " venäläiset prosessorit"? Jos puhumme ihmisistä, niin " Kaikki venäläiset eivät ole venäläisiä" Ja jos puhumme prosessoreista, niin he Venäjän kieli. Info 100%, tarkistin!

Joten mitä meillä on tänään? Ja tänään eletään vuoden 2017 alkupuoliskoa ja venäläiset prosessorit kehittyvät hellittämättä.

Venäläiset prosessorit "Prosessori-9", jotka tukevat DDR4-muistia

Mitä näemme tekstityksessä? Tuen kanssa! Tämä ei tarkoita sen enempää Prosessori-9 kilpailee suoraan olemassa olevien jättiläisten Intelin ja AMD:n kanssa. Täällä voit todella olla ylpeä Venäjästä.

Mikä on prosessori-9? Tämä on venäläisen huippuprosessorin koodinimi Elbrus-16S MCST-yhtiöltä. Sen tuotanto on tarkoitus aloittaa vuonna 2018. Prosessorivaihtoehtoja on kaksi, 8- ja 16-ytiminen. Yleensä prosessorin ominaisuudet ovat:

Elbrus-16S-prosessorin tärkeimmät tekniset ominaisuudet (Prosessori-9)

Aiemmin venäläisiin Elbrus-prosessoreihin perustuvia tietokoneita myytiin jo. 4 C, mutta ne maksavat kohtuuttoman paljon rahaa. Tämä johtui siitä, että prosessorien massatuotantoa ei ollut perustettu. Nämä tietokoneet olivat melko kokeellisia malleja, ja siksi maksoivat jopa 400 000 ruplaa. Elbrus-16S:n tapauksessa tilannetta korjaa prosessorien massatuotanto Taiwanissa. Lisäksi valmistajan on ymmärrettävä, että sellaisella hinnalla ei voi puhua kilpailukyvystä.

Miksi emme vertaa tietoja koko Elbrus-prosessorivalikoimasta? Se on kiinnostavaa.

	Elbrus-2C+	Elbrus-4S	Elbrus-8S	Elbrus-16S
Julkaisuvuosi	2011	2014	2015-2018 (tarkistukset)	2018 (suunnitelma)
Kellotaajuus	500 MHz	800 MHz	1300 MHz	1500 MHz
Bittinen syvyys	Minä en tiedä	32/64 bittiä	64-bittinen	64/128 bittiä
Ydinten lukumäärä	2	4	8	8/16
Tason 1 välimuisti	64 kt	128 kt	—	—
Tason 2 välimuisti	1 Mt	8 Mt	4 Mt	4 Mt
Tason 3 välimuisti	—	—	16 Mt	16 Mt
RAM-tuki	DDR2-800	3 x DDR3-1600	4 x DDR3-1600	4 x DDR4-2400
Tekninen prosessi	90 nm	65 nm	28 nm	28 nm (tai 16)
Tehon kulutus	25 W	45 W	75-100 W	60-90 W

Myös prosessoreita kehitettiin, jotka eivät läpäisseet valtion sertifiointia. Mutta se oli kauan sitten, eikä se ole totta.

Mitä mieltä olet venäläisistä prosessoreista? Ostaisitko tietokoneen 400 000 eurolla vain siksi, että se on venäläinen? Kirjoita, puhutaan tästä aiheesta.

Venäläiset Elbrus-prosessorit Inteliin verrattuna

Tiedän, että monet ihmiset ovat kiinnostuneita vertaamaan venäläisiä prosessoreita Intel-prosessoreihin. Tämä ei ole yllättävää, venäläiset ovat ylpeä kansa, ja siksi haluamme verrata saavutuksiamme parhaimpiin. Ja Intel on täsmälleen sellainen tietokoneprosessorien maailmassa.

Yleensä verkossa kelluu tietty tabletti, joka vertaa Elbrus-prosessoreja Inteliin, mutta päätä itse kuinka luotettava se on. Ymmärtääkseni tämä taulukko ei ole uusi, koska vertailu ei ole uusimpien Intel-prosessorien kanssa, mutta joitain niistä ei silti voida kutsua vanhoiksi. Lisäksi jotkut niistä ovat tehokkaita Intel Xeon -palvelinprosessoreita. Taulukossa voit verrata tärkeimpiä teknisiä ominaisuuksia sekä prosessorien suorituskykyä Gigaflopsissa.

Yleensä tässä on itse prosessorien vertailutaulukko. Lisään sen siinä muodossa, jossa sen löysin, älä tuomitse tiukasti. On sääli, että Elbruksen ja Intelin välillä on vain vertailu, eikä siellä ole Baikal-prosessoreita, mutta uskon, että silti löytyy harrastajia, jotka korjaavat tämän puutteen.

Venäläiset Elbrus-prosessorit: vertailu Inteliin

Venäläiset prosessorit Baikal-T1 ja Baikal-M

Jos Elbrus-prosessorit on tarkoitettu puhtaasti tietokoneisiin ja ovat valmiita kilpailemaan muiden valmistavien yritysten kanssa, niin Baikal-prosessorit on tarkoitettu enemmän teollisuussegmentille, eivätkä ne kohtaa niin kovaa kilpailua. Kuitenkin jo kehitetään Baikal-M-prosessoreita, joita voidaan käyttää pöytätietokoneisiin.

Prosessori Baikal-T1

Mukaan Baikal Electronics, prosessorit Baikal-T1 voidaan käyttää reitittimiin, reitittimiin ja muihin tietoliikennelaitteisiin, ohuisiin asiakkaisiin ja toimistolaitteisiin, multimediakeskuksiin, CNC-järjestelmiin. Mutta prosessorit Baikal-M voi tulla työtietokoneiden, teollisuusautomaation ja kiinteistönhallinnan sydän. Mielenkiintoisempaa jo! Mutta teknisistä ominaisuuksista ei ole vielä tarkempaa tietoa. Tiedämme vain, että se toimii kahdeksalla ARMv8-A-ytimellä ja siinä on jopa kahdeksan ARM Mali-T628 -grafiikkaydintä, ja mikä on myös tärkeää, valmistajat lupaavat tehdä siitä erittäin energiatehokkaan. Katsotaan, mitä tapahtuu.

Kun kirjoitin artikkelia, tein pyynnön Baikal Electronics JSC:lle, ja vastaus ei odottanut kauan. Hyvä Andrey Petrovich Malafeev (PR- ja yritystapahtumien johtaja), jakoi ystävällisesti kanssamme uusimmat tiedot Baikal-M-prosessorista.

Yhtiö aikoo julkaista ensimmäiset suunnittelunäytteet Baikal-M-prosessorista tänä syksynä. Ja sitten lainaan, jotta en vääristäisi tiedon ydintä millään tavalla:

- Lainauksen alku -

Baikal-M-prosessori on järjestelmä sirulla, joka sisältää energiatehokkaita prosessoriytimiä ARMv 8 -arkkitehtuurilla, grafiikkaalijärjestelmän ja joukon nopeita liitäntöjä. Baikal-M:tä voidaan käyttää luotettavana prosessorina, jolla on laajat tietosuojaominaisuudet useissa laitteissa B2C- ja B2B-segmenteissä.

Baikal-M:n käyttöalueet

yksiosainen, automatisoitu työasema, graafinen työasema;

kodin (toimiston) mediakeskus;

videokonferenssipalvelin ja -pääte;

mikropalvelin;

Pienyritystason NAS;

reititin/palomuuri.

Baikal -M -prosessorin korkea integrointiaste mahdollistaa kompaktien tuotteiden kehittämisen, joissa pääosa lisäarvosta tulee kotimaisesta prosessorista. Täydellisten tietojen saatavuus sirun loogisesta piiristä ja fyysisestä topologiasta yhdistettynä luotettuihin ohjelmistoihin ja niihin liittyviin laitteistoratkaisuihin mahdollistaa prosessorin käytön osana järjestelmiä, jotka on suunniteltu käsittelemään luottamuksellisia tietoja.

Sovellettava ohjelmisto

ARMv8 (AArch64) -arkkitehtuurin laaja käyttö mahdollistaa valtavan määrän valmiita sovelluksia ja järjestelmäohjelmistoja. Linux- ja Android-käyttöjärjestelmiä tuetaan, myös binäärijakelujen ja -pakettien tasolla. Saatavilla on useita laitteita, jotka liitetään PCIe- ja USB-väyliin. Baikal Electronicsin toimittama ohjelmistopaketti sisältää Linux-ytimen lähde- ja käännösmuodossa sekä Baikal-M:n sisäänrakennettujen ohjaimien ajurit.

Baikal-M-prosessorin pääominaisuudet

8 ARM Cortex-A57 ydintä (64-bittinen).

Toimintataajuus jopa 2 GHz.

Laitteistotuki virtualisoinnille ja Trust Zone -teknologialle koko SoC:n tasolla.

Liitäntä RAM-muistiin – kaksi 64-bittistä DDR3/DDR4-2133 kanavaa ECC-tuella

Välimuisti – 4 Mt (L2) + 8 Mt (L3).

Kahdeksanytiminen Mali-T628-näytönohjain.

HDMI- ja LVDS-tuen tarjoava videopolku

Laitteistovideon dekoodaus

Sisäänrakennettu PCI Express -ohjain tukee 16 PCIe Gen -kaistaa. 3.

Kaksi 10 Gigabit Ethernet -ohjainta, kaksi Gigabit Ethernet -ohjainta. Ohjaimet tukevat virtuaalisia VLANeja ja liikenteen priorisointia.

Kaksi SATA 6G -ohjainta, joiden tiedonsiirtonopeus on jopa 6 Gbit/s.

2 USB v.3.0 kanavaa ja 4 USB v.2.0 kanavaa.

Tuki luotetulle käynnistystilalle.

Laitteistokiihdyttimet, jotka tukevat GOST 28147-89, GOST R 34.11-2012.

Energiankulutus - enintään 30 W.

— Lainauksen loppu —

Mitä sanotte, ystävät? Tekivätkö venäläiset prosessorit sinuun vaikutuksen vai jättivätkö sinut välinpitämättömäksi? Henkilökohtaisesti uskon venäläisen digitaalitekniikan suureen tulevaisuuteen!

Luitko loppuun asti?

Oliko tästä artikkelista apua?

Ei oikeastaan

Mistä et oikein pitänyt? Oliko artikkeli epätäydellinen vai väärä?
Kirjoita kommentteihin ja lupaamme parantaa!

Tässä artikkelissa näytämme kuinka kuvantunnistusteknologiat toimivat Elbrus-4C:ssä ja uudessa Elbrus-8C:ssä: tarkastelemme useita tietokonenäköongelmia, puhumme hieman niiden ratkaisemiseen käytettävistä algoritmeista, esittelemme benchmarking-tuloksia ja näytämme lopuksi videon. .

Elbrus-8S on uusi 8-ytiminen MCST-prosessori VLIW-arkkitehtuurilla. Testasimme teknisen näytteen taajuudella 1,3 GHz. Ehkä se lisääntyy vieläkin sarjatuotannossa.

Tässä on vertailu Elbrus-4S:n ja Elbrus-8S:n ominaisuuksista.

	Elbrus-4S	Elbrus-8S
Kellotaajuus, MHz	800	1300
Ydinten lukumäärä	4	8
Operaatioiden määrä sykliä kohden (ydintä kohti)	23 asti	25 asti
L1-välimuisti, ydintä kohti	64 kt	64 kt
L2-välimuisti, ydintä kohti	2 Mt	512 kt
L3-välimuisti, jaettu	-	16 Mt
RAM-muistin organisaatio	Jopa 3 kanavaa DDR3-1600 ECC	Jopa 4 kanavaa DDR3-1600 ECC
Tekninen prosessi	65 nm	28 nm
Transistorien lukumäärä	986 miljoonaa	2730 miljoonaa
SIMD-ohjeen leveys	64 bittiä	64 bittiä
Moniprosessorituki	jopa 4 prosessoria	jopa 4 prosessoria
Tuotannon aloitusvuosi	2014	2016
käyttöjärjestelmä	Käyttöjärjestelmä "Elbrus" 3.0-rc27	Käyttöjärjestelmä "Elbrus" 3.0-rc26
lcc-kääntäjän versio	1.21.18	1.21.14

Elbrus-8S:ssä kellotaajuus kasvoi yli puolitoista kertaa, ytimien määrä kaksinkertaistui ja itse arkkitehtuuri parani.

Esimerkiksi Elbrus-8C voi suorittaa jopa 25 käskyä kellojaksoa kohden ottamatta huomioon SIMD:tä (verrattuna 23:een Elbrus-4C:lle).

Tärkeä: emme tehneet erityistä optimointia Elbrus-8S:lle. EML-kirjastoa käytettiin, mutta Elbrus-optimoinnin määrä projekteissamme on nyt selvästi vähemmän kuin muissa arkkitehtuureissa: siellä se on kasvanut vähitellen useiden vuosien aikana, ja olemme työskennelleet Elbrus-alustalla ei niin kauan sitten emmekä ole. niin aktiivisesti. Tärkeimmät aikaa vievät toiminnot on tietysti optimoitu, mutta loput eivät ole vielä päässeet siihen.

Venäjän passin tunnustaminen

Tietysti päätimme aloittaa meille uuden alustan hallitsemisen lanseeraamalla tuotteemme Smart IDReader 1.6, joka tarjoaa ominaisuudet passien, ajokorttien, pankkikorttien ja muiden asiakirjojen tunnistamiseen. On huomattava, että tämän sovelluksen vakioversio voi tehokkaasti käyttää enintään 4 säiettä yhden asiakirjan tunnistamisessa. Mobiililaitteille tämä on enemmän kuin tarpeeksi, mutta pöytätietokoneiden prosessorien vertailussa tämä voi johtaa moniytimisjärjestelmien suorituskyvyn aliarviointiin.

Toimitettu Elbrus OS -versio ja lcc-kääntäjä ei vaatinut erityisiä muutoksia lähdekoodiin ja kokosimme projektimme ilman vaikeuksia. Huomaa, että uudessa versiossa on täysi tuki C++11:lle (se ilmestyi myös Elbrus-4C:n uusimmissa lcc-versioissa), mikä on hyvä uutinen.

Aluksi päätimme tarkistaa, kuinka Venäjän passintunnistus, josta jo kirjoitimme, toimii Elbrus-8S: ssä. Testasimme kahdessa tilassa: passin etsiminen ja tunnistaminen erillisessä kehyksessä (mikä tahansa tila) ja verkkokamerasta kuvatussa videossa (verkkokameratila). Missä tahansa tilassa passin peruutuksen tunnistus suoritetaan yhdessä kehyksessä, ja passi voidaan sijoittaa mihin tahansa kehyksen osaan ja suunnata millä tahansa tavalla. Verkkokameratilassa vain valokuvallinen passisivu tunnistetaan ja kehyksiä käsitellään. Oletetaan, että passin viivat ovat vaakasuorat ja passi liikkuu hieman kehysten välillä. Eri kehyksistä saatu tieto integroidaan tunnistamisen laadun parantamiseksi.

Testausta varten otimme 1000 kuvaa kutakin tilaa kohden ja mittasimme keskimääräisen tunnistuksen toiminta-ajan (eli ajan ilman kuvan lataamista) ajettaessa 1 säikeessä ja ajettaessa rinnakkain. Tuloksena oleva käyttöaika on esitetty alla olevassa taulukossa.

Yksisäikeisen tilan tulokset ovat melko yhdenmukaisia odotusten kanssa: lisääntyneestä taajuudesta johtuvan kiihtyvyyden (ja 4C:n ja 8C:n taajuussuhde on 1300 / 800 = 1,625) lisäksi pieni kiihtyvyys parantuneen arkkitehtuurin takia havaittavissa.

Kun ajettiin enimmäismäärällä säikeitä, molempien tilojen kiihtyvyys oli 1,7. Vaikuttaa siltä, että Elbrus-8C: n ytimien määrä on kaksi kertaa suurempi kuin 4C: ssä. Joten missä on 4 lisäytimen aiheuttama nopeus? Tosiasia on, että tunnistusalgoritmimme käyttää aktiivisesti vain 4 säiettä ja skaalautuu heikosti edelleen, joten suorituskyvyn lisäys on melko merkityksetön.

Seuraavaksi päätimme varmistaa, että molempien prosessorien kaikki ytimet olivat täysin ladattuja, ja käynnistimme useita passintunnistusprosesseja. Jokainen tunnistuskutsu rinnastettiin samalla tavalla kuin edellisessä kokeessa, mutta tässä passin käsittelyaikaan sisältyi kuvan lataaminen tiedostosta. Aikamittaukset suoritettiin samoilla tuhannella passilla. Tulokset, kun Elbrus on täysin ladattu, näkyvät alla:

Missä tahansa tilassa tuloksena saatu nopeuttaminen lähestyi odotettua nopeutusta ~3,6-kertaisesti, mikä jäi pienemmäksi johtuen siitä, että otimme huomioon kuvan lataamiseen tiedostosta kuluvan ajan. Verkkokameratilan tapauksessa latausajan vaikutus on vielä suurempi ja siksi kiihtyvyys osoittautui vaatimattomammaksi - 2,5-kertaiseksi.

Auton tunnistus

Tietyn tyyppisten esineiden havaitseminen on yksi teknisen näön klassisista ongelmista. Tämä voi olla kasvojen, ihmisten, hylättyjen esineiden tai minkä tahansa muun tyyppisten esineiden havaitsemista, joilla on ilmeisiä erityispiirteitä.

Esimerkkiämme päätimme ottaa tehtäväksi havaita samaan suuntaan liikkuvat autot. Tällaista ilmaisinta voidaan käyttää automaattisissa ajoneuvon ohjausjärjestelmissä, rekisterikilpien tunnistusjärjestelmissä jne. Kuvasimme epäröimättä videon koulutusta ja testausta varten autotallentimella toimistomme lähellä. Ilmaisimena käytimme Viola-Jones-kaskadiluokitinta. Lisäksi sovelsimme löydettyjen autojen paikkojen eksponentiaalista tasoitusta niille, joita havaitsimme useita kehyksiä peräkkäin. On syytä huomata, että tunnistus suoritetaan vain ROI (reion of interest) -suorakulmiossa, joka ei peitä koko kehystä, koska ei ole mitään järkeä yrittää havaita automme sisäosia sekä autoja, jotka eivät ole täysin mukana kehyksessä.

Joten algoritmimme koostui seuraavista vaiheista:

ROI-suorakulmion leikkaaminen kehyksen keskeltä.
Värillisen ROI-kuvan muuntaminen harmaaksi.
Suosi Viola-Jonesin piirteitä.
Tässä vaiheessa kuva skaalataan, rakennetaan karttoja apuominaisuuksista (esimerkiksi suunnatuista rajoista) ja lasketaan kaikille piirteille kumulatiiviset summat Haar-aaltojen laskemiseksi nopeasti.
Viola-Jones-luokittelun suorittaminen useissa ikkunoissa.
Täällä siirretään muutamalla askeleella suorakaiteen muotoisia ikkunoita, joista luokitin käynnistetään. Jos luokitin antoi positiivisen vastauksen, niin kohde havaittiin, ts. ikkunan sisällä oleva kuva vastaa autoa. Tässä tapauksessa tarkennetaan kuva-aluetta, jossa kohde sijaitsee: samankokoiset, mutta pienemmät ikkunat valitaan ensisijaisen tunnistuksen läheisyydestä ja syötetään myös luokittelijan tuloon. Kaikki löydetyt esineet tallennetaan jatkokäsittelyä varten. Tämä toimenpide toistetaan useille tulokuvan mittakaavoille.
Tämä vaihe muodostaa itse asiassa ongelman pääasiallisen laskennallisen monimutkaisuuden ja rinnastaminen suoritettiin erityisesti sitä varten. Käytimme tbb-kirjastoa valitsemaan automaattisesti säikeiden tehokkaan määrän.
Ilmaisimen käytön jälkeen saatujen havaintojen joukon käsittely. Koska monet saadut havainnot voivat olla hyvin lähellä ja vastata samaa kohdetta, yhdistämme havainnot, joilla on riittävän suuri leikkausalue. Tuloksena on joukko suorakulmioita, jotka osoittavat havaittujen autojen sijainnin.
Edellisten ja nykyisten kehysten havaintojen vertailu. Katsomme, että sama kohde havaittiin, jos suorakulmioiden leikkausalue on yli puolet nykyisen suorakulmion pinta-alasta. Tasoitamme kohteen sijainnin kaavoilla:
x i = x i+ (1-α) x i-1
y i = y i+ (1-α) y i-1
w i = w i+ (1-α) w i-1
Hei = Hei+ (1-α) h i-1
Missä ( x, y)--- suorakulmion vasemman yläkulman koordinaatit, w Ja h ovat sen leveys ja korkeus, ja α on kokeellisesti valittu vakiokerroin.

Syöttötiedot: sarja värikehyksiä, joiden koko on 800x600 pikseliä.
Tässä ja alla arvioidaksemme fps (kuva sekunnissa) käytimme keskimääräistä toiminta-aikaa ohjelman 10 ajon aikana. Tässä tapauksessa huomioitiin vain kuvankäsittelyaika, koska nyt työskentelimme tallennetun videon parissa ja kuvat ladattiin yksinkertaisesti tiedostosta, mutta todellisessa järjestelmässä ne saattoivat tulla esimerkiksi kamerasta. Kävi ilmi, että tunnistus toimii erittäin kohtuullisella nopeudella, tuottaen 15,5 fps Elbrus-4C:llä ja 35,6 fps Elbrus-8C:llä. Elbrus-8C:ssä prosessorin kuorma ei ole läheskään täynnä, vaikka kaikki ytimet ovat käytössä huipussaan. Ilmeisesti tämä johtuu siitä, että kaikkia tämän ongelman laskelmia ei rinnastettu. Esimerkiksi ennen Viola-Jones-ilmaisimen käyttöä teemme jokaiselle kehykselle melko raskaat apumuunnokset, ja tämä osa järjestelmästä toimii peräkkäin.

Nyt on mielenosoituksen aika. Sovelluksen käyttöliittymä ja renderöinti tehdään tavallisilla Qt5-työkaluilla. Ylimääräistä optimointia ei tehty.

Elbrus-4S

Elbrus-8S

Visuaalinen lokalisointi

Tässä sovelluksessa päätimme näyttää visuaalisen lokalisoinnin ominaisuuspisteiden perusteella. Käyttämällä Google Street View -panoraamoja ja GPS-seurantaa opetimme järjestelmämme tunnistamaan kameran sijainnin käyttämättä tietoja sen GPS-koordinaateista tai muista ulkoisista tiedoista. Tällaista järjestelmää voidaan käyttää droneille ja roboteille varanavigointijärjestelmänä, nykyisen sijainnin selvittämiseen tai toimimaan järjestelmissä, joissa ei ole GPS:ää.

Aluksi käsittelimme panoraamatietokannan GPS-koordinaateilla. Otimme 660 kuvaa, jotka kattoivat noin 0,4 km^2 Moskovan katuja:

Sitten loimme kuvista kuvauksen ominaisuuspisteiden avulla. Jokaiselle kuvalle me:

Löysimme YAPE (Yet Another Point Detector) -algoritmilla (Yet Another Point Detector) -algoritmilla (Yet Another Point Detector) kolmelle kehysasteikolle erikoispisteet (itse kehys, 4/3-kertainen kehys ja puolet vähennetty kehys) ja laskemme niille RFD-kuvaajat.
Tallensimme sen koordinaatit, joukon erikoispisteitä ja niiden kuvaajia. Koska vertaamme tämän jälkeen nykyisen kehyksen piirrepisteiden kuvaajia tietokannassamme olevien kuvaajien arvoihin, on kätevää tallentaa kuvaajat puuhun käyttämällä Hamming-etäisyyttä mittarina. Tallennetun tiedon kokonaiskoko osoittautui hieman yli 15 MB.

Tällä valmistelut ovat valmiit, siirrytään nyt siihen, mitä tapahtuu suoraan ohjelman toiminnan aikana:

Muuntaa värikuvan harmaaksi.
Suorittaa automaattisen kontrastin.
Etsi erikoispisteitä kolmelle kehysasteikolle (myös kertoimilla 1, 0,75 ja 0,5) käyttämällä YAPE-algoritmia ja laskemalla niille RFD-kuvaajat. Nämä algoritmit ovat osittain rinnakkaisia, mutta melko suuri osa laskelmista pysyy peräkkäisinä. Lisäksi niitä ei ole vielä optimoitu Elbrus-alustalle.
Tuloksena olevalle kuvaajajoukolle suoritetaan samankaltaisten kuvaajien haku puuhun tallennettujen joukosta ja määritetään useita samankaltaisimpia kehyksiä. Eri kuvailijoille puuhaku rinnastetaan käyttämällä tbb:tä. Tässä tapauksessa valitsemme videon ensimmäisille viidelle ruudulle 10 lähintä ruutua ja otamme sitten vain 5 kuvaa.
Valitut kehykset käyvät läpi lisäsuodatuksen "poikkeamien" poistamiseksi, koska ajoneuvon liikerata on yleensä jatkuva.

Syöttötiedot: sarja värikehyksiä, joiden koko on 800x600 pikseliä.

1.71 Passi, missä tahansa tila, s/frame, täysi prosessorikuorma 1.38 0.43 3.2 Passi, verkkokameratila, c/frame, täysi prosessorikuorma 0.47 0.19 2.5

Passintunnistuksen tulokset olivat melko vaatimattomia, koska sovelluksemme nykyisessä muodossaan ei voi tehokkaasti käyttää enempää kuin 4 säiettä. Tilanne on samanlainen auton tunnistuksen ja visuaalisen sijainnin kanssa: algoritmeissa on ei-rinnakkaiset osiot, joten lineaarista skaalausta ei voida odottaa ytimien määrän kasvaessa. Kuitenkin, missä ei ole rajoituksia sovelluksille, jotka lataavat kaikkia prosessoriytimiä, kasvu on 3,2-kertainen, mikä on lähellä teoreettista 3,6-kertaista rajaa. Suorituskykyero MCST-suorittimien sukupolvien välillä on keskimäärin noin 2-3 kertaa, mikä on erittäin miellyttävää. Pelkästään taajuutta lisäämällä ja arkkitehtuuria parantamalla saamme yli 1,7-kertaisen voiton. MCST saavuttaa nopeasti Intelin strategian lisätä 5 % vuodessa.

Täydellä kuormituksella suoritetuissa testeissä emme kokeneet ongelmia jäätymisen tai kaatumisen kanssa, mikä kertoo prosessorin arkkitehtuurin kypsyydestä. Elbrus-8C:ssä kehitetty VLIW-lähestymistapa mahdollistaa erilaisten tietokonenäköalgoritmien reaaliaikaisen toiminnan, ja EML-kirjasto sisältää erittäin vankan joukon matemaattisia toimintoja, jotka säästävät aikaa niille, jotka eivät aio optimoida koodia. itse. Lopuksi teimme toisen kokeen, jossa suoritimme 3 demoa kerralla (lokalisointi, autohaku ja kasvohaku) yhdellä Elbrus-8C-prosessorilla ja saimme keskimääräisen prosessorikuorman noin 80 %. Ei kommentteja täällä.

Haluamme sanoa suuret kiitokset yritykselle sekä MCST:n ja INEUM Brookin työntekijöille mahdollisuudesta kokeilla Elbrus-8S:ää ja onnitella heitä - kahdeksan on enemmän kuin arvokas prosessori ja toivottaa heille menestystä!

Käytetyt lähteet

P. Viola, M. Jones, "Nopea objektin tunnistus käyttäen tehostettua yksinkertaisten ominaisuuksien sarjaa", Proceedings of CVPR 2001.
B. Fan, Q. Kong, T. Trzcinski, Z. H. Wang, C. Pan ja P. Fua, "Receptive fields selection for binary feature description", IEEE Trans. Kuvankäsittely, s. 2583–2595, 2014.

05.25.2017, to, 11:45, Moskovan aikaa , Teksti: Vladimir Bakhur

Rostec esitteli ensimmäiset näytteet kotimaisiin 8-ytimiseen 64-bittisiin Elbrus 8C -prosessoreihin perustuvista tietokoneista ja palvelimista. Uusien sirujen ensimmäisten palvelimien asennuserien odotetaan valmistuvan vuoden 2017 loppuun mennessä.

Ensimmäiset näytteet toimivista tietokoneista ja palvelimista

Yhdistynyt holding Ruselectronics (osa Rosteciä) esitteli ensimmäiset näytteet Elbrus-8S-mikroprosessoreihin perustuvista henkilökohtaisista tietokoneista ja palvelimista CIPR 2017 -konferenssissa Innopoliksessa (Tatarstan). Uusi kotimainen teknologia on kehittäjien mukaan lisännyt suorituskykyä ja takaa käyttäjille korkean tietoturvan tason. Uudet palvelimet on suunniteltu käsittelemään suuria tietomääriä, myös reaaliajassa.

Elbrus-8C-sirujen pohjalta suunnitellaan järjestävän palvelimien, työasemien ja muiden tietokonelaitteiden massatuotantoa valtion virastoille ja yritysrakenteille, joilla on kohonneet tietoturvavaatimukset, sekä käytettäväksi korkean suorituskyvyn laskennan alalla, signaalinkäsittely ja tietoliikenne.

”Tämä on uuden sukupolven kotimaista tietotekniikkaa. Kaikki kokoonpanovaiheet suoritetaan tuotantolaitoksillamme ja kotimaisten yhteistyökumppaneiden yrityksissä. Kaikki tämä takaa laitteiden korkean tietoturvan, Ruselectronicsin varatoimitusjohtaja sanoi. Arseni Brykin. -- Odotamme, että ensimmäinen pilottierä uuteen prosessoriin perustuvia henkilökohtaisia tietokoneita on valmis vuoden 2017 toisen neljänneksen loppuun mennessä. Esittelemme tänään näytteitä uusista laitteista CIPR-konferenssissa Innopoliksessa.

Elbrus-8C-sirut 4-prosessorin palvelinjärjestelmässä

Elbrus-ohjelmisto- ja laitteistoalustojen kehittämisen ja toteutuksen osana yhdistyneen Ruselectronicsin toteuttaa nimetty Institute of Electronic Control Machines (INEUM). I.S. Brook. Elbrus-8S-prosessorin kehittämisestä ja tuotannosta vastaa MCST-yhtiö. Ensimmäiset näytteet Elbrus-8C-prosessoreista laboratoriokokeisiin saatiin vuoden 2014 lopussa. Prosessorien massatuotanto toteutetaan 28 nanometrin teknologisen prosessin standardien mukaisesti.

Ruselectronicsin mukaan Elbrus-8S:ään perustuvien 2- ja 4-prosessoristen palvelimien asennuserä julkaistaan vuoden 2017 loppuun mennessä.

Tekniset yksityiskohdat

Universaalit mikroprosessorit "Elbrus-8S" ovat täysin venäläinen kehitys. Jokaisessa prosessoripiirissä on 8 prosessoriydintä, joissa on parannettu 64-bittinen kolmannen sukupolven Elbrus-arkkitehtuuri, L2-välimuisti, jonka kokonaiskapasiteetti on 4 Mt (8 x 512 KB) ja L3-välimuisti, jonka kapasiteetti on 16 Mt.

Elbrus-arkkitehtuurin ominaisuudet tarkoittavat kykyä suorittaa jopa 25 toimintoa jokaiselle ytimelle yhdessä konesyklissä, mikä varmistaa korkean suorituskyvyn kohtuullisella kellotaajuudella. Sirut tukevat dynaamista binäärikäännöstekniikkaa, joka mahdollistaa x86-binäärikoodeilla jaettujen sovellusten ja käyttöjärjestelmien suorittamisen, myös monisäikeisessä tilassa.

Elbrus-8S-prosessorin arkkitehtuuri

Elbrus-8S-prosessorit tukevat suojattua laskentatilaa erityisellä laitteistoohjauksella muistirakenteen eheydelle, mikä mahdollistaa sitä käyttävien ohjelmistojärjestelmien korkean tietoturvan.

Elbrus-8C-prosessorien toimintataajuus on 1,3 GHz, laskentateho on noin 250 gigaflopsia sirua kohden yhden tarkkuuden operaatioissa (FP32).

Verrattuna 4-ytimiseen Elbrus-4C-prosessoreihin uusien Elbrus-8C-prosessorisirujen huippusuorituskyky on kehittäjien mukaan 3-5 kertaa suurempi ja I/O-kanavien suorituskyky 8 kertaa suurempi.

Prosessori "Elbrus-8S"

Elbrus-8C-prosessorit on suunniteltu toimimaan DDR3-1600-muistin kanssa ECC-tuella (jopa 4 muistiohjainta). On mahdollista järjestää moniprosessorijärjestelmiä tukemalla jopa 4 prosessoria järjestelmässä; Välimuistin johdonmukaisuuden tukemiseksi on otettu käyttöön snooping-suodatus. Prosessorien välistä vaihtoa varten on 3 duplex-kanavaa, joiden kunkin kaistanleveys on 16 Gt/s (8 Gt/s kumpaankin suuntaan).

Elbrus-8S-prosessorit ovat yhteensopivia oheisliitäntäohjaimen ("south bridge" KPI-2) kanssa. KPI-2-sirut tukevat PCI-Express 2.0 -väylää (PCI-Express 16 + 4 kaistaa), 3 Gigabit Ethernet -porttia, jopa 8 SATA 3.0 -laitetta, jopa 8 USB 2.0 -porttia, jopa 7 laitetta PCI 32/66 -väylässä , sekä liitännät IDE, Audio HDA, RS-232, IEEE1284, SPI, I2C ja GPIO.

Elbrus-8S-alustalla on binääriyhteensopivuusjärjestelmä x86/x86-64-binäärikoodeilla. On myös mahdollista kehittää sovellusohjelmistoja ja testejä laitteiden itsediagnoosiin.

Elbrus-alustan peruskäyttöjärjestelmä on Linux-ytimeen perustuva Elbrus OS. Alustaohjelmointijärjestelmä tukee kieliä C, C++, Java, Fortran-77, Fortran-90.

Toveri kromia 63 Löysin Internetistä asiakirjan "Elbrus-8C-prosessorin suorituskyky laskennallisen kaasudynamiikan supertietokonesovelluksissa" ja jaoin linkin siihen sivuston ixbt.com teemafoorumilla.

Artikkelissa esitellään Elbrus-8C-prosessorin osana Elbrus-801-tietokonetta testauksen tulokset Intelin ja AMD:n mikroprosessoreihin verrattuna.

Testaus suoritettiin ohjelmistojärjestelmillä, jotka on suunniteltu kaasudynamiikan ja aeroakustiikan ongelmien kolmiulotteiseen mallinnukseen rakenteettomilla hybridiverkoilla.

(artikkeli on lyhennetty, artikkelin koko versio löytyy alla olevasta linkistä)

NOISEtte ohjelmistopaketti

NOISEtten pääsovellusalue on ensisijaisesti ilmailuteollisuudessa esiintyvien aerodynamiikan ja aeroakustisten ongelmien supertietokonesimulointi.

Tapir ohjelmistopaketti

Suunniteltu laskemaan viskoosin kokoonpuristuvan kaasun aliääni- ja yliäänivirtauksia. Navier-Stokes-yhtälöiden diskretisointi suoritetaan äärellisen tilavuuden menetelmällä määrittämällä ruudukkofunktioiden arvot rakenteettoman hybridiverkon elementtien massakeskuksissa.

Elbrus-8S-prosessoriarkkitehtuurin ominaisuudet

Kahdeksanytiminen Elbrus-8C-prosessori kuuluu VLIW-arkkitehtuuriperheeseen. Jokainen ydin voi suorittaa jopa 25 erilaista perusoperaatiota yhdessä kellojaksossa. Laajan tiimin (WT) rakenne mahdollistaa:

1 ohjauksen siirtokomento: hyppää, kutsu, palaa;

3 predikaattilogiikan komentoa;

Jopa 6 aritmeettis-loogista operaatiota: kokonaisluku-, bitti-, siirto- ja reaaliaritmetiikka (mukaan lukien yhdistetty), muistin haut, vertailut, siirrot ja kolmiosaiset operaattorit;

4 komentoa lineaarisesti säännöllisen datan saamiseksi, mukaan lukien vastaavan osoittimen kasvattaminen;

1 jaksolaskurin ohjauskomento;

16 tavua vakiodataa;

Rekisteröi ikkunan ohjauskomennot.

Todellista aritmetiikkaa varten on 6 aritmeettista logiikkayksikköä, joissa on täysin liukuhihnalliset kerto- ja yhteenlaskulaitteet FP32- ja FP64-muodossa, jotka mahdollistavat fmul*, fadd*/fsub*, yhdistettyjen (koostuu kahdesta operaatiosta) fmul_add*/sub* suorittamisen ja loppuun saattamisen. /rsub* joka lyönti.

On myös yksi osittain liukuhihna- jako- ja neliöjuurilaite, jonka avulla yksi fdiv*, fsqrt*-operaatioista voidaan suorittaa kerran kahdessa kellojaksossa. Tarkempi kuvaus arkkitehtuurista on esitetty kohdassa.

Muistialijärjestelmä, jossa on 4 DDR3 1600 -kanavaa, tarjoaa maksimikäyttönopeuden 51,2 Gt/s. Välimuistihierarkia esitetään

Tason 1 datavälimuisti ydintä kohti, 64 kt, 4-suuntainen;

Tason 1 käskyvälimuisti ydintä kohti, 128 kt, 4-suuntainen;

L2-välimuisti ydintä kohti, 512 kt, 4-suuntainen;

Sisältää jaetun kolmannen tason välimuistin 8 ytimelle, 16 Mt, 16-suuntainen.

Prosessorit voidaan yhdistää jopa 4 prosessorin NUMA-järjestelmään, joiden välillä käytetään linkkejä, joiden kaistanleveys on jopa 8 Gt/s kumpaankin suuntaan.

Vertailevaa testausta varten valittiin useita Elbrus-8C-prosessorin länsimaisia analogeja. Niiden joukossa on kaksi prosessoria, joilla on samanlaiset ominaisuudet, jotka myös toimivat DDR3-muistilla ja on valmistettu 22 nm:n tai suuremmalla prosessitekniikalla: AMD Opteron 6276, Interlagos-ydin; Intel Xeon E5-2650v2, Ivy Bridge -ydin. Mukana on myös tämän hetken moderneimpia Intel-prosessoreita, jotka toimivat DDR4-muistilla ja on valmistettu 14 nm:n prosessitekniikalla: Intel Xeon E5-2683v4, Broadwell-ydin ja Intel Xeon Platinum 8160, Skylake-ydin. Taulukossa 3 on esitetty ytimien lukumäärä, kellotaajuus (GHz), huippusuorituskyky (GFLOPS), muistin kaistanleveys (GB/s), virrankulutus (W), prosessitekniikka (nm).

Rinnakkainen kiihtyvyys.

Tämä mittaus osoittaa, kuinka monta kertaa laskenta moniytimisessä prosessorissa monisäikeisessä tilassa OpenMP-rinnakkaisuudella kiihtyy suhteessa peräkkäiseen suoritukseen samalla prosessorilla. 8 ytimen kiihtyvyystulokset on esitetty taulukossa 4. Elbrus-8C-prosessorin kiihtyvyys, 5-6-kertainen, vastaa yleisesti hyvin länsimaisia analogeja. Useimmilla prosessoreilla voidaan havaita toimintojen heikko kiihtyvyys alhaisella laskennallisella intensiteetillä, jota rajoittaa muistin kaistanleveys (SpMV, Grad). Samaan aikaan Skylake osoittaa yhtä suurta kiihtyvyyttä kaikissa toiminnoissa tehokkaamman muistialijärjestelmän, jossa on 6 DDR4-kanavaa, ansiosta.

Yhden ytimen vertailu.

Tämä testi vertaa tietokoneen suorituskykyä peräkkäisessä tilassa. Taulukossa 5 esitetyt tulokset osoittavat suorituskykysuhteen Elbrus-8C-prosessorilla, jonka toimintanopeus on otettu yhdeksi. NOISEtte-koodilla ero Intel-prosessoreihin oli noin 3 kertaa. Kellokohtaisen suorituskyvyn osalta tämä vastaa noin puolitoistakertaista eroa (koska Intel-prosessoreilla on noin kaksinkertainen taajuus). AMD:hen verrattuna tappio oli noin 1,4-kertainen. On tärkeää huomata, että NOISEttella on huomattavasti monimutkaisempi toteutus ja toimintalogiikka (laskennallinen osa on noin kymmeniä tuhansia rivejä) kuin Tapirilla (noin tuhat riviä). Useimmissa resurssiintensiivisissä NOISEtte-toiminnoissa ei tehty erityistä mukauttamista Elbrus-arkkitehtuuriin. Tapirille suoritettiin suhteellisen yksinkertainen laskelmien sovittaminen Elbrus-arkkitehtuuriin, joka on kuvattu yllä kohdassa 3. Tapir-koodissa ero Inteliin oli vain noin puolitoistakertainen. Siten tässä sovelluksessa Elbrus-8S osoittaa korkeampaa suorituskykyä kelloa kohden kuin Intel-vastineet. AMD-ydin osoittautui noin puolitoista kertaa Elbrusta hitaammaksi.

Suorituskykyvertailu 8 ytimessä.

Tämä testi vertaa tietojenkäsittelyn suorituskykyä monisäikeisessä tilassa samalla määrällä ytimiä kuin Elbrus-8S. Rinnakkaistilassa muistialijärjestelmän suorituskyvyllä on jo merkittävä vaikutus tulokseen, koska 8 säiettä voi tyhjentää muistin kaistanleveyden kokonaan. Tulokset suhteesta Elbrukseen on esitetty taulukossa 6. Taulukkoon 5 verrattuna voidaan todeta, että NOISEtte-koodissa suhde muuttui Elbruksen hyväksi. Tässä testissä Elbrus ylittää AMD:n molemmilla koodeilla. Tapir-koodin ero Inteliin oli noin 2 kertaa.

Koko prosessorin vertailu.

Tämä testi vertailee monisäikeisen tietojenkäsittelyn suorituskykyä kaikissa prosessorin ytimissä. Tulokset on esitetty taulukossa 7.

AMD-prosessori näyttää huomattavasti Inteliä heikommalta. 8-ytiminen Elbrus-8S ylittää tämän 16-ytimisen prosessorin Tapir-koodilla. Suuren OpenMP-kiihtyvyyden ansiosta 16- ja 24-ytimiset Intel-prosessorit kasvoivat huomattavasti verrattuna 8-ytimiseen, ero Elbrukseen oli jo noin 3-7-kertainen.

Tietokoneen suorituskyky.

Todellisen suorituskyvyn mittaamiseksi laskettiin Tapir-koodin aritmeettisten operaatioiden määrä. Myös esimerkkinä muistin kaistanleveyden ankarasti rajoittamasta operaatiosta valittiin NOISEtte SpMV -toiminto, jolla on alhaisin laskennallinen intensiteetti tarkasteluista - noin 0,2 FLOP per tavu, mikä on noin 10 kertaa pienempi kuin Tapir-koodi. Tulokset on esitetty taulukossa 8, jossa näkyy myös laitteiden teoreettisen huipun prosenttiosuus.

Tuloksista käy selvästi ilmi, että SpMV:llä saavutetaan huomattavasti pienempi prosenttiosuus huipusta, koska prosessorien aritmeettisten operaatioiden lukumäärän huippu on monta kertaa suurempi kuin muistin kaistanleveys. Suorituskyvyn ja suorituskyvyn välinen suhde voidaan arvioida taulukossa 3.

Voit myös huomata Skylaken alhaisen huippuprosentin, jolla on nelinkertainen toimintojen määrä kelloa kohti verrattuna edeltäjäänsä Broadwelliin. Voidaan päätellä, että tarkasteltavana oleville algoritmeille, pääasiassa muistin kaistanleveyden rajoituksista johtuen, vektoriaritmeettisten laitteiden lukumäärän kaksinkertaistaminen ja vektorirekisterien kaksinkertaistaminen eivät lisänneet suorituskykyä.

Johtopäätös

Moniytimisillä Elbrus8S-prosessoreilla laskentatehoa tutkittiin laskennallisen kaasudynamiikan tosielämän sovelluksilla. Strukturoimattomien verkkojen puristettavien virtausten mallintamiseen käytettiin kahta ohjelmistopakettia, NOISEtte ja Tapir.

Useita Intel Xeon -prosessorien malleja harkittiin viiden vuoden takaisista malleista nykyaikaisimpiin. Ihmeitä ei tietenkään tapahdu; Elbrus osoittautui odotetusti hitaammaksi kuin Intel-prosessorit. Ytimen suorituskyvyn menetys oli keskimäärin 2,6-kertainen NOISEtte-koodilla ja 1,5-kertainen Tapir-koodilla. Tämä vaikuttaa varsin hyvältä tulokselta, kun otetaan huomioon, että Elbrus-8S:n kellotaajuus on noin puolet matalampi, eli kellotaajuudella mitattuna Elbrus ei ole Inteliä huonompi. Lisäksi noin kaksinkertainen tappio tässä sovelluksissa on tyypillistä jopa Intelin pääkilpailijalle AMD-prosessoreille. Mitä tulee koko prosessorin suorituskykyyn, tappio suhteessa Inteliin NOISEtte-koodissa vaihteli 2,5-kertaisesta 8-ytimistä Ivy Bridgestä 6,8-kertaiseen 24-ytimiseen Skylakeen ja Tapir-koodiin - 2-5-kertaiseen. , vastaavasti.

Vertailun vuoksi tarkastelimme 16-ytimistä AMD Opteron 6276 -prosessoria noin 5 vuoden takaa. Tämä prosessori ylitti vastaavan 8-ytimisen Intel Ivy Bridgen noin 2 kertaa. NOISEtte-koodilla 8-ytiminen Elbrus-8C taajuudella 1,3 GHz osoittautui vain 1,4 kertaa hitaammaksi kuin 16-ytiminen AMD-prosessori taajuudella 2,3 GHz, ja Tapir-koodilla Elbrus suoritti AMD:n 12 %.

On myös syytä huomata, että Intel-prosessorit eivät paranna ydinsuorituskykyä tämäntyyppisissä sovelluksissa. Lisäksi moderni Intel Skylake -ydin osoittautui 20 % hitaammaksi kuin 5 vuoden takainen Intel Ivy Bridge -ydin. Vektorirekisterien laajentaminen ja aritmeettisten yksiköiden lukumäärän kaksinkertaistaminen eivät lisänneet suorituskykyä (käyttämällä vain kääntäjän automaattisia vektorointityökaluja) rajoitetun muistin kaistanleveyden vuoksi. Nykyaikaisten prosessorien suorituskyvyn kasvu johtuu pääasiassa ytimien määrän kasvusta.

Samaan aikaan Elbrus-8C-prosessorin ydinsuorituskyky verrattuna edellisen sukupolven Elbrus-4C:hen on kasvanut noin puolitoista kertaa. Tämä antaa meille mahdollisuuden toivoa, että seuraavan sukupolven Elbrus-16C-prosessorien julkaisun myötä ero pienenee entisestään. Seuraavassa mallissa, joka on määrä julkaista vuonna 2022, odotetaan olevan 16 ydintä, jotka toimivat 2 GHz:llä. Sen odotetaan käyttävän 4–8 kanavaa DDR4-2666-muistia, mikä voi kasvattaa muistialijärjestelmän kaistanleveyttä yli 3 kertaa. Myös optimoivan kääntäjän edelleen parantaminen voi edistää merkittävästi tuottavuuden kasvua.

Kahdeksanytiminen Elbrus-8S-prosessori, joka on valmistettu 28 nm:n prosessiteknologialla, esiteltiin neljännessä konferenssissa ”IT sotilas-teollisen kompleksin palveluksessa”. Suurin sotilas-teollisen kompleksin kehittäjät ja IT-asiantuntijat kokoava erikoistapahtuma alkoi eilen Innopoliksessa (Tatarstanin tasavalta) ja kestää 29. toukokuuta asti.

Rosteciin kuuluvan United Instrument-Making Corporationin pääjohtaja Alexander Yakunin ilmoitti Venäjälle uutta teknologista prosessia käyttävän kotimaisen mikroprosessorin luomisen viimeisestä vaiheesta.

"Baikal-projektin puitteissa, jota toteutamme yhdessä T-Platforms-yrityksen kanssa, saavutettiin läpimurtotulos", Aleksanteri Yakunin selitti. – Ensimmäinen suunnittelunäyte Venäjälle vallankumouksellisesta 28 nm:n prosessitekniikalla varustetusta Baikal-T-prosessorista on juuri julkaistu.

Seuraava venäläinen kehitys on Elbrus-prosessorien uusi sukupolvi, joka perustuu samaan tekniseen prosessiin. Sen luominen on edennyt viimeiseen vaiheeseensa, seuraavaa suunnittelujulkaisua testataan parhaillaan."

Elbrus-8S:n kehittämisen suorittaa I. S. Brukin mukaan nimetty Institute of Electronic Control Machines (INEUM) MCST-yhtiön osallistuessa. Sen ominaisuudet näyttävät tältä:

kristalliala 350 neliötä. mm;
kahdeksan identtistä prosessoriydintä ilman hypersäikeistystä;
512 KB L2-välimuisti ydintä kohti;
kolmannen tason välimuisti – jaettu, 16 Mt;
oma arkkitehtuuri "Elbrus", kehitetty JSC "MCST":ssä;
komentojärjestelmä, jossa on vektorikiihdyttimiä ja ohjeita matemaattisten laskelmien, salauksen ja signaalinkäsittelyn nopeuttamiseksi. Niitä ei ole jaettu erillisiin laajennuksiin, vaan ne toimitetaan aluksi;
optimoiva binaarikoodin käännösjärjestelmä varmistaa yhteensopivuuden x86/x86-64-arkkitehtuurien kanssa samalla kun se on lisensoitu Intelistä riippumattomasti ja saavuttaa 80 %:n suorituskyvyn alkuperäisestä;
kyky suorittaa komentoja suoraan ilman binäärikäännöstä kahdessakymmenessä käyttöjärjestelmäjakelussa ja yli tuhannessa suositussa sovelluksessa (luettelo kasvaa nopeasti);
sisäänrakennetut mekanismit, jotka suojaavat haitallisen koodin suorittamiselta: strukturoitu muisti, jossa on pääsy objekteihin kuvaajien kautta ja kontekstuaalinen suojaus kielilaajuuksien perusteella; objektien rajojen rikkomusten havaitseminen (puskurin ylivuoto), alustamattoman tiedon käyttö ja vaaralliset poikkeamat ohjelmointistandardeista.
tuki neljälle PC3-12800-standardin muistipaikalle (DIMM DDR3-1600);
30 toimenpiteen suorittaminen sykliä kohden;
1,3 GHz:n kellotaajuus on suunniteltu taajuuskatto, jolla kaikkien kahdeksan ytimen 100 % kuormitus on mahdollista rajoittamattoman ajan normaaleissa olosuhteissa. Epäsuotuisissa (ja erityisesti kenttä) käyttöolosuhteissa työskentelyyn, ylikuumenemisen estämiseksi toteutetaan automaattinen taajuuden vähennysjärjestelmä (vastaavasti kuristukseen) ja (tilapäinen) yksittäisten ytimien ohjelmiston sammutus käyttöjärjestelmän avulla;
250 Gflopsin huippusuorituskyky yhden tarkkuuden liukulukulaskelmissa (FP32), kun kaikki FPU:t on ladattu täyteen;
tehohäviö tasolla 60 – 90 W (lasketut luvut);
prosessori juotetaan suoraan levylle, mikä vähentää sirujen pakkauskustannuksia ja niiden hylkäämistä.

Elbrus-8S toimii yhdessä kotimaisesti kehitetyn oheisliitäntäohjaimen - KPI-2:n kanssa.

Tämä tällä hetkellä 65 nm:n prosessiteknologialla valmistettu siru tukee 20 PCI-Express 2.0 -väyläkaistaa (8+8+4), kolmea gigabitin Ethernet-verkkoohjainta, kahdeksaa SATA v.3.0 -porttia ja kahdeksaa USB 2.0 -porttia. Tiedonvaihtonopeus prosessorin kanssa KPI-2:ssa on 16 Gt/s.

Perusrajapintojen tukemisen lisäksi se sisältää sisäänrakennetun SPMC-ohjaimen, joka tarjoaa virransäästötoimintoja, sekä keskeytysohjaimen.

Laitteisto on vuorovaikutuksessa käyttöjärjestelmän kanssa oman BIOS-mikrokoodinsa kautta. On mahdollista työskennellä Linux-, FreeBSD-, QNX-, Windows XP -jakelujen kanssa, mutta kriittisiin sovelluksiin suosittelemme Elbrus-käyttöjärjestelmää, joka perustuu Linux-ytimeen 2.6.33. MCST-tiimi on tehnyt paljon työtä luodakseen reaaliaikaisen käyttöjärjestelmän, jossa on omat mekanismit keskeytysten käsittelyyn, synkronointiin, muistinhallintaan ja tunnistelaskujen tukeen. Kaiken tämän tarkoituksena on vapauttaa kotimaisen prosessoriarkkitehtuurin potentiaali ja suojautua yleisiltä hyväksikäytöiltä.

Ohjelmakoodin optimointi Elbrus-arkkitehtuurin huomioon ottaen saavutetaan käyttämällä erikoistuneita kehitystyökaluja: optimointi kääntäjiä C- ja C++-, Fortran- ja Java-kielille, debuggerit, työkalut ja kirjastot rinnakkaislaskutoimituksiin. Jälkimmäisistä on mahdollista käyttää MPI (Message Passing Interface) -liittymää ja avointa OpenMP-standardia.

Elbrus-prosessorien kehitys.

Elbrus-prosessoreissa suoritettaviksi optimoituja apuohjelmia ja apukomponentteja ollaan jo luomassa. Näitä ovat apuohjelmat, palvelut, yleiskäyttöiset kirjastot, tietokantatuki, grafiikkaalijärjestelmä (perustuu Xorgiin, GTK+:aan ja Qt:hen), työkaluja verkon ja oheislaitteiden kanssa työskentelyyn.

Ensisijaisena tehtävänä on tehdä tuontikorvaus tärkeissä sotilas-teollisissa kompleksilaitoksissa ja strategisesti tärkeissä Venäjän infrastruktuurilaitoksissa. Computerra puhuu jo teknisestä mahdollisuudesta luoda laitteistotason troijalainen Intel-prosessoreihin Ivy Bridge -arkkitehtuurilla, mikä on erittäin vaikea havaita. Tämä tutkijoiden työ tehtiin Massachusettsin yliopistossa ja se asetettiin konseptin todisteeksi - samanlaisia kirjanmerkkejä voidaan luoda muissa prosessoreissa.

"Teknologian käyttö vieraiden avainkomponenttien kanssa luo suuria uhkia maalle kriittisillä johtamisen ja tuotannon alueilla", Aleksanteri Jakunin toteaa. "Ensinnäkin tietosuojan näkökulmasta ja piilotettujen mahdollisuuksien ulkopuolelta vaikuttaa laitteiden toimintaan."

Elbrus-8C-prosessorin tilatestit on määrä suorittaa tämän vuoden lopussa. Jos ne onnistuvat, sarjatuotanto alkaa vuonna 2016. Toistaiseksi puhumme enemmän pientuotannosta noin 50 tuhannen prosessorin tasolla vuodessa, mutta tämä on jo valtava askel venäläiselle mikroelektroniikalle.

"Tämän vuoden lopussa tai ensi vuoden alussa T-Platformsin pitäisi saada päätökseen uuden Baikal-M-prosessorin työt, ja vuonna 2018 aiomme esitellä Elbrus-16S:n samalla 28 Nm:n tekniikalla, taajuudella 1,5 GHz ja yli 512 GFlopsin suorituskyky”, Alexander Yakunin kertoo välittömistä suunnitelmistaan. On jo tiedossa, että seuraava Elbrus-prosessori suorittaa 50 operaatiota kellojaksoa kohden. Sen tuottavuuden arvioidaan olevan 2,5 kertaa korkeampi kuin Elbrus-8S:n.

Artikkelissa käytetään JSC United Instrument-Making Corporationin materiaaleja.