Elbrus 8 növbəti ilə. Rus prosessorları

Rus prosessoru Elbrus-8S

Günortanız xeyir, əziz oxucular. Bugünkü mövzu avid vətənpərvərlər üçün çox maraqlı olacaq. Get Rusiya!!! Və bu gün rus prosessorları haqqında danışacağıq " Elbrus"Və" Baykal" Təəssüf ki, məqalə həqiqətən adlandırıla bilməz " Rusiya istehsalı olan prosessorlar", çünki əslində onlar Rusiyada deyil, Şərqi Asiyada (dünyanın aparıcı elektronikalarının əksəriyyəti kimi) istehsal olunur. Ancaq fəxr edə bilərik ki, Rusiya dünyada öz mikroprosessorlarını inkişaf etdirməyə qadir olan nadir ölkələrdən biridir, çünki gələcək onların arxasındadır.

Aranızda məqalə axtarmaq üçün “ Rus prosessorları"? Əgər insanlar haqqında danışırıqsa, onda " Rusların hamısı rus deyil" Əgər prosessorlar haqqında danışırıqsa, onda onlar rus. Məlumat 100%, yoxladım!

Beləliklə, bu gün üçün nəyimiz var? Və bu gün biz 2017-ci ilin birinci yarısındayıq və rus prosessorları amansızcasına inkişaf edir.

DDR4 yaddaş dəstəyi ilə rus prosessorları "Processor-9"

Altyazıda nə görürük? Dəstəyi ilə! Bu, bundan başqa heç nə demək deyil Prosessor-9 mövcud nəhəng Intel və AMD ilə birbaşa rəqabətdə olacaq. Burada həqiqətən Rusiya ilə fəxr edə bilərsiniz.

Prosessor-9 nədir? Bu, ən yaxşı rus prosessorunun kod adıdır Elbrus-16S MCST şirkətindən. 2018-ci ildə istehsalına başlanılması planlaşdırılır. 8 və 16 nüvəli iki prosessor variantı olacaq. Ümumiyyətlə, prosessorun xüsusiyyətləri:

Elbrus-16S prosessorunun əsas texniki xüsusiyyətləri (Prosessor-9)

Əvvəllər Rusiyanın Elbrus prosessorlarına əsaslanan kompüterlər artıq satılırdı. 4 C, lakin onlar hədsiz miqdarda pula başa gəlirlər. Bu prosessorların kütləvi istehsalının qurulmaması ilə əlaqədar idi. Bu kompüterlər olduqca eksperimental modellər idi və buna görə də 400.000 rubla qədər başa gəlir. Elbrus-16S vəziyyətində vəziyyət Tayvanda prosessorların kütləvi istehsalı ilə düzəldiləcəkdir. Bundan əlavə, istehsalçı başa düşməlidir ki, belə bir qiymətə heç bir rəqabət qabiliyyətindən söhbət gedə bilməz.

Niyə biz Elbrus prosessorlarının bütün xətti haqqında məlumatları müqayisə etmirik? Bu maraqlıdır.

Elbrus-2C+ Elbrus-4S Elbrus-8S Elbrus-16S
Buraxılış ili 2011 2014 2015-2018 (düzəlişlər) 2018 (plan)
Saat tezliyi 500 MHz 800 MHz 1300 MHz 1500 MHz
Bit dərinliyi Mən bilmirəm 32/64 bit 64 bit 64/128 bit
Nüvələrin sayı 2 4 8 8/16
Səviyyə 1 önbellek 64 KB 128 KB
Səviyyə 2 önbellek 1 MB 8 MB 4 MB 4 MB
Səviyyə 3 önbellek 16 MB 16 MB
RAM dəstəyi DDR2-800 3 x DDR3-1600 4 x DDR3-1600 4 x DDR4-2400
Texniki proses 90 nm 65 nm 28 nm 28 nm (və ya 16)
Enerji istehlakı 25 Vt 45 Vt 75-100 Vt 60-90 Vt

Dövlət sertifikatından keçməmiş prosessorların inkişafı da var idi. Ancaq bu çoxdan idi və doğru deyil.

Rus prosessorları haqqında nə düşünürsünüz? Sırf rus olduğu üçün 400 minə komputer alardınız? Yaz, bu mövzuda danışaq.

Rus Elbrus prosessorları Intel ilə müqayisədə

Bilirəm ki, bir çoxları Rusiya prosessorlarını Intel prosessorları ilə müqayisə etməkdə maraqlıdır. Bu təəccüblü deyil, ruslar qürurlu xalqdır və buna görə də nailiyyətlərimizi ən yaxşılarla müqayisə etmək istəyirik. Və Intel kompüter prosessorları dünyasında məhz belədir.

Ümumiyyətlə, şəbəkədə Elbrus prosessorlarını Intel ilə müqayisə edən müəyyən bir planşet var, lakin bunun nə qədər etibarlı olduğuna özünüz qərar verin. Anladığım kimi, bu cədvəl yeni deyil, çünki müqayisə ən yeni Intel prosessorları ilə aparılmır, lakin bəzilərini hələ də köhnə adlandırmaq olmaz. Üstəlik, onlardan bəziləri güclü Intel Xeon server prosessorlarıdır. Cədvəldə siz əsas texniki xüsusiyyətləri, eləcə də Gigaflops-da prosessorların işini müqayisə edə bilərsiniz.

Ümumiyyətlə, prosessor müqayisə cədvəlinin özü budur. Mən onu tapdığım formada daxil edirəm, ciddi mühakimə etməyin. Təəssüf ki, Elbrus və Intel arasında yalnız bir müqayisə var və orada Baykal prosessorları yoxdur, amma düşünürəm ki, hələ də bu çatışmazlığı düzəldəcək həvəskarlar olacaq.

Rus Elbrus prosessorları: Intel ilə müqayisə

Rus prosessorları Baykal-T1 və Baykal-M

Əgər Elbrus prosessorları sırf kompüterlər üçün nəzərdə tutulubsa və digər istehsal şirkətləri ilə rəqabət aparmağa hazırdırsa, onda Baykal prosessorları daha çox sənaye seqmenti üçün nəzərdə tutulub və belə sərt rəqabətlə üzləşməyəcək. Bununla belə, “Baikal-M” prosessorları artıq hazırlanır, onlardan stolüstü kompüterlər üçün istifadə oluna bilər.

Prosessor Baikal-T1

Baikal Electronics-ə görə, prosessorlar Baykal-T1 marşrutlaşdırıcılar, marşrutlaşdırıcılar və digər telekommunikasiya avadanlıqları, nazik müştərilər və ofis avadanlıqları, multimedia mərkəzləri, CNC sistemləri üçün istifadə edilə bilər. Amma prosessorlar Baykal-M iş kompüterlərinin, sənaye avtomatlaşdırılmasının və bina idarəçiliyinin ürəyinə çevrilə bilər. Artıq daha maraqlıdır! Lakin texniki xüsusiyyətləri haqqında hələ ki, ətraflı məlumat yoxdur. Biz yalnız onu bilirik ki, o, 8 ARMv8-A nüvəsində işləyəcək və bortda səkkizə qədər ARM Mali-T628 qrafik nüvəsinə sahib olacaq və ən vacibi odur ki, istehsalçılar onu çox enerjiyə qənaət edəcəklərini vəd edirlər. Gəlin görək nə baş verir.

Məqaləni yazarkən “Baykal Electronics” ASC-yə müraciət etdim və cavab çox keçmədi. Hörmətli Andrey Petroviç Malafeev (ictimaiyyətlə əlaqələr və korporativ tədbirlər meneceri) bizimlə paylaşdı. Baikal-M prosessoru haqqında ən son məlumatlar.

Şirkət bu ilin payızında Baykal-M prosessorunun ilk mühəndislik nümunələrini buraxmağı planlaşdırır. Və sonra məlumatın mahiyyətini heç bir şəkildə təhrif etməmək üçün sitat gətirirəm:

- Sitatın başlanğıcı -

Baykal-M prosessoru ARMv 8 arxitekturasına malik enerjiyə qənaət edən prosessor nüvələrini, qrafik altsistemini və yüksək sürətli interfeyslər dəstini özündə birləşdirən çip üzərində qurulmuş sistemdir. Baikal-M B2C və B2B seqmentlərindəki bir sıra cihazlarda geniş məlumat mühafizə imkanlarına malik etibarlı prosessor kimi istifadə oluna bilər.

Baykal-M-in tətbiqi sahələri

  • monoblok, avtomatlaşdırılmış iş stansiyası, qrafik iş stansiyası;
  • ev (ofis) media mərkəzi;
  • video konfrans serveri və terminal;
  • mikroserver;
  • Kiçik müəssisə səviyyəsində NAS;
  • marşrutlaşdırıcı / firewall.

Baikal -M prosessorunun yüksək inteqrasiya dərəcəsi əlavə dəyərin əsas payının yerli prosessordan gəldiyi yığcam məhsulların hazırlanmasına imkan verir. Etibarlı proqram təminatı və əlaqəli aparat həlləri ilə birlikdə çipin məntiqi sxemi və fiziki topologiyası haqqında tam məlumatın mövcudluğu prosessordan məxfi məlumatları emal etmək üçün nəzərdə tutulmuş sistemlərin bir hissəsi kimi istifadə etməyə imkan verir.

Tətbiq olunan proqram təminatı

ARMv8 (AArch64) arxitekturasının geniş istifadəsi çoxlu sayda hazır proqram və sistem proqram təminatından istifadə etməyə imkan verir. Linux və Android əməliyyat sistemləri, o cümlədən binar paylamalar və paketlər səviyyəsində dəstəklənir. PCIe və USB avtobuslarına qoşulan çoxsaylı qurğular mövcuddur. Baikal Electronics tərəfindən təmin edilən proqram paketinə mənbə və tərtib edilmiş formada Linux nüvəsi, həmçinin Baikal-M-də quraşdırılmış nəzarətçilər üçün drayverlər daxildir.

Baykal-M prosessorunun əsas xüsusiyyətləri

  • 8 ARM Cortex-A57 nüvəsi (64 bit).
  • 2 GHz-ə qədər işləmə tezliyi.
  • Bütün SoC səviyyəsində virtuallaşdırma və Trust Zone texnologiyası üçün aparat dəstəyi.
  • RAM ilə interfeys – ECC dəstəyi ilə iki 64-bit DDR3/DDR4-2133 kanal
  • Keş yaddaşı – 4 MB (L2) + 8 MB (L3).
  • Səkkiz nüvəli Mali-T628 qrafik koprosessoru.
  • HDMI, LVDS üçün dəstək verən video yolu
  • Avadanlıq videonun dekodlanması
  • Quraşdırılmış PCI Express nəzarətçi 16 PCIe Gen xəttini dəstəkləyir. 3.
  • İki 10 Gigabit Ethernet nəzarətçisi, iki Gigabit Ethernet nəzarətçisi. Nəzarətçilər virtual VLAN-ları və trafikin prioritetləşdirilməsini dəstəkləyir.
  • Hər biri 6 Gbit/s-ə qədər məlumat ötürmə sürətini təmin edən iki SATA 6G nəzarətçisi.
  • 2 USB v.3.0 kanalı və 4 USB v.2.0 kanalı.
  • Etibarlı yükləmə rejimi üçün dəstək.
  • GOST 28147-89, GOST R 34.11-2012-ni dəstəkləyən aparat sürətləndiriciləri.
  • Enerji istehlakı - 30 Vt-dan çox deyil.

- Sitatın sonu -

Nə deyirsiniz dostlar? Rus prosessorları sizi heyran etdi və ya sizi laqeyd qoydu? Şəxsən mən Rusiyanın rəqəmsal texnologiyalarının böyük gələcəyinə inanıram!

Axıra kimi oxumusan?

Bu məqalə faydalı oldu?

Həqiqətən yox

Tam olaraq nəyi bəyənmədiniz? Məqalə natamam idi, yoxsa yalan?
Şərhlərdə yazın və biz təkmilləşdirməyə söz veririk!

Bu yazıda biz Elbrus-4C və yeni Elbrus-8C-də təsvirin tanınması texnologiyalarının necə işlədiyini göstərəcəyik: bir neçə kompüter görmə probleminə baxacağıq, onların həlli alqoritmləri haqqında bir az danışacağıq, müqayisə nəticələrini təqdim edəcəyik və nəhayət bir video nümayiş etdirəcəyik. .



Elbrus-8S VLIW arxitekturasına malik yeni 8 nüvəli MCST prosessorudur. 1,3 GHz tezliyi olan mühəndislik nümunəsini sınaqdan keçirdik. Ola bilsin ki, seriyalı istehsalda daha da artsın.



Budur Elbrus-4S və Elbrus-8S-in xüsusiyyətlərinin müqayisəsi.


Elbrus-4S Elbrus-8S
Saat tezliyi, MHz 800 1300
Nüvələrin sayı 4 8
Dövr üzrə əməliyyatların sayı (nüvə başına) 23-ə qədər 25-ə qədər
L1 önbellek, hər nüvə üçün 64 KB 64 KB
L2 önbellek, hər nüvə üçün 2 MB 512 KB
L3 önbelleği, paylaşıldı - 16 MB
RAM-ın təşkili 3 kanala qədər DDR3-1600 ECC 4 kanala qədər DDR3-1600 ECC
Texnoloji proses 65 nm 28 nm
Tranzistorların sayı 986 milyon 2730 milyon
SIMD təlimat genişliyi 64 bit 64 bit
Multiprosessor dəstəyi 4 prosessora qədər 4 prosessora qədər
İstehsalın başlanğıc ili 2014 2016
əməliyyat sistemi ƏS "Elbrus" 3.0-rc27 ƏS "Elbrus" 3.0-rc26
lcc kompilyator versiyası 1.21.18 1.21.14

Elbrus-8S-də saat tezliyi bir yarım dəfədən çox artdı, nüvələrin sayı iki dəfə artdı və arxitekturanın özü təkmilləşdirildi.


Məsələn, Elbrus-8C SIMD-ni nəzərə almadan hər saatda 25-ə qədər təlimatı yerinə yetirə bilər (Elbrus-4C üçün 23-ə qarşı).


Əhəmiyyətli: Elbrus-8S üçün heç bir xüsusi optimallaşdırma aparmamışıq. EML kitabxanasından istifadə edildi, lakin layihələrimizdə Elbrus üçün optimallaşdırmanın miqdarı indi digər arxitekturalara nisbətən daha azdır: orada bir neçə il ərzində tədricən artmaqdadır, lakin biz Elbrus platformasında çox yaxında işləyirik və yox. belə fəal. Əsas vaxt aparan funksiyalar, əlbəttə ki, optimallaşdırılıb, lakin qalanları hələ buna nail olmayıb.

Rusiya pasportunun tanınması

Təbii ki, pasportların, sürücülük vəsiqələrinin, bank kartlarının və digər sənədlərin tanınması imkanlarını təmin edən Smart IDReader 1.6 məhsulumuzun istifadəyə verilməsi ilə bizim üçün yeni platformanın mənimsənilməsinə başlamaq qərarına gəldik. Qeyd etmək lazımdır ki, bu proqramın standart versiyası bir sənədin tanınması zamanı 4-dən çox olmayan ipdən səmərəli istifadə edə bilər. Mobil cihazlar üçün bu, kifayət qədərdir, lakin masaüstü prosessorları müqayisə edərkən bu, çoxnüvəli sistemlərin işinin düzgün qiymətləndirilməməsinə səbəb ola bilər.


Bizə təqdim olunan Elbrus ƏS versiyası və lcc kompilyatoru mənbə kodunda heç bir xüsusi dəyişiklik tələb etmədi və biz heç bir çətinlik çəkmədən layihəmizi yığdıq. Qeyd edək ki, yeni versiyada C++11 üçün tam dəstək var (o, Elbrus-4C üçün lcc proqramının son versiyalarında da peyda olub), bu yaxşı xəbərdir.


Başlamaq üçün, artıq yazdığımız Rusiya pasportunun tanınmasının Elbrus-8S-də necə işlədiyini yoxlamaq qərarına gəldik. Biz iki rejimdə sınaqdan keçirdik: ayrı bir çərçivədə (istənilən yerdə rejim) və veb-kameradan çəkilmiş videoda (veb kamera rejimi) pasportun axtarışı və tanınması. İstənilən yerdə rejimdə pasportun dəyişdirilməsinin tanınması bir çərçivədə həyata keçirilir və pasport çərçivənin istənilən hissəsində yerləşə və istənilən şəkildə istiqamətləndirilə bilər. Veb kamera rejimində yalnız fotoşəkili olan pasport səhifəsi tanınır və bir sıra çərçivələr işlənir. Ehtimal olunur ki, pasportun xətləri üfüqidir və pasport çərçivələr arasında bir qədər hərəkət edir. Tanınma keyfiyyətini yaxşılaşdırmaq üçün müxtəlif çərçivələrdən alınan məlumatlar inteqrasiya olunur.


Test üçün hər rejim üçün 1000 şəkil çəkdik və 1 ipdə işləyərkən və paralelləşdirmə ilə işləyərkən tanınmanın orta işləmə müddətini (yəni şəklin yüklənməsini nəzərə almadan vaxtı) ölçdük. Nəticədə iş vaxtı aşağıdakı cədvəldə göstərilmişdir.



Tək yivli rejim üçün nəticələr gözlənilənlə tamamilə uyğundur: artan tezlik səbəbindən sürətlənməyə əlavə olaraq (və 4C və 8C-nin tezlik nisbəti 1300 / 800 = 1.625-dir), təkmilləşdirilmiş arxitektura səbəbindən bir qədər sürətlənmə nəzərə çarpan.


Maksimum sayda iplə işləyərkən hər iki rejim üçün sürətlənmə 1,7 idi. Belə görünür ki, Elbrus-8C-də nüvələrin sayı 4C-dən iki dəfə çoxdur. Bəs əlavə 4 nüvəyə görə sürətlənmə haradadır? Fakt budur ki, tanınma alqoritmimiz aktiv olaraq yalnız 4 ipdən istifadə edir və zəif şəkildə daha da genişlənir, buna görə də performans qazancı olduqca əhəmiyyətsizdir.


Sonra, hər iki prosessorun bütün nüvələrinin tam yüklənməsini təmin etmək qərarına gəldik və bir neçə pasportun tanınması prosesinə başladıq. Hər bir tanınma çağırışı əvvəlki eksperimentdə olduğu kimi paralelləşdirildi, lakin burada pasportun işlənmə vaxtı fayldan şəkil yükləməyi əhatə edirdi. Eyni min pasportda vaxt ölçmələri aparıldı. Elbrus tam yükləndikdə nəticələr aşağıda göstərilir:



İstənilən yerdə rejimi üçün nəticədə əldə edilən sürət gözlənilən sürətə ~3,6 dəfə yaxınlaşdı və fayldan şəkil yükləmək üçün lazım olan vaxtı nəzərə aldığımız üçün qısaldıldı. Veb kamera rejimi vəziyyətində, yükləmə vaxtının təsiri daha da böyükdür və buna görə də sürətlənmə daha təvazökar oldu - 2,5 dəfə.

Avtomobil aşkarlanması

Verilmiş tipli obyektlərin aşkarlanması texniki görmənin klassik problemlərindən biridir. Bu, üzlərin, insanların, tərk edilmiş obyektlərin və ya aşkar fərqləndirici xüsusiyyətlərə malik olan hər hansı digər növ obyektlərin aşkarlanması ola bilər.


Nümunəmiz üçün eyni istiqamətdə hərəkət edən avtomobilləri aşkar etmək vəzifəsini götürməyə qərar verdik. Belə bir detektor avtomobilin avtomatik idarəetmə sistemlərində, nömrə nişanının tanınması sistemlərində və s. Biz tərəddüd etmədən ofisimizin yaxınlığındakı avtoregistratordan istifadə edərək təlim və sınaq üçün video çəkdik. Biz detektor kimi Viola-Jones şəlaləli klassifikatorundan istifadə etdik. Bundan əlavə, biz ardıcıl olaraq bir neçə kadr müşahidə etdiyimiz avtomobillər üçün tapılan avtomobillərin mövqelərinin eksponensial hamarlanması tətbiq etdik. Qeyd etmək lazımdır ki, aşkarlama yalnız bütün çərçivəni tutmayan ROI (maraq bölgəsi) düzbucaqlısında həyata keçirilir, çünki avtomobilimizin daxili hissələrini, eləcə də tam olmayan avtomobilləri aşkar etməyə çalışmağın mənası yoxdur. çərçivəyə daxildir.


Beləliklə, alqoritmimiz aşağıdakı addımlardan ibarət idi:

  1. Çərçivənin mərkəzində ROI düzbucağının kəsilməsi.
  2. Rəngli ROI şəklinin boz rəngə çevrilməsi.
  3. Viola-Jones xüsusiyyətlərinə üstünlük verilir.
    Bu mərhələdə təsvir ölçülür, köməkçi xüsusiyyətlərin xəritələri (məsələn, yönəldilmiş sərhədlər) qurulur və Haar dalğalarını tez hesablamaq üçün bütün xüsusiyyətlər üçün məcmu məbləğlər hesablanır.
  4. Birdən çox pəncərədə Viola-Jones təsnifatını işə salmaq.
    Burada bəzi addımlarla düzbucaqlı pəncərələr köçürülür, onun üzərində təsnifat işə salınır. Təsnifat müsbət cavab verdisə, o zaman obyekt aşkar edildi, yəni. pəncərənin içindəki şəkil avtomobilə uyğun gəlir. Bu halda, obyektin yerləşdiyi təsvir sahəsi dəqiqləşdirilir: eyni ölçülü, lakin daha kiçik pilləli pəncərələr ilkin aşkarlamanın yaxınlığında seçilir və həmçinin təsnifat girişinə verilir. Tapılan bütün obyektlər sonrakı emal üçün saxlanılır. Bu prosedur giriş şəklinin bir neçə miqyası üçün təkrarlanır.
    Bu mərhələ əslində problemin əsas hesablama mürəkkəbliyini təşkil edir və paralelləşdirmə xüsusi olaraq onun üçün aparılmışdır. Mövzuların effektiv sayını avtomatik seçmək üçün tbb kitabxanasından istifadə etdik.
  5. Detektordan istifadə etdikdən sonra əldə edilən aşkarlamalar massivinin işlənməsi. Alınan bir sıra aşkarlamalar çox yaxın ola və eyni obyektə uyğun ola bildiyi üçün biz kifayət qədər böyük kəsişmə sahəsinə malik aşkarlamaları birləşdiririk. Nəticə aşkar edilmiş avtomobillərin mövqeyini göstərən düzbucaqlılar massividir.
  6. Əvvəlki və cari çərçivələrdə aşkarlamaların müqayisəsi. Hesab edirik ki, düzbucaqlıların kəsişmə sahəsi cari düzbucağın sahəsinin yarısından çox olarsa, eyni obyekt aşkar edilmişdir. Düsturlardan istifadə edərək obyektin mövqeyini hamarlayırıq:
    x i = x i+ (1-α) x i-1
    y i = y i+ (1-α) y i-1
    w i = w i+ (1-α) w i-1
    h i = h i+ (1-α) h i-1
    harada ( x, y)--- düzbucaqlının yuxarı sol küncünün koordinatları, wh müvafiq olaraq onun eni və hündürlüyü, α isə eksperimental olaraq seçilmiş sabit əmsaldır.

Giriş məlumatları: 800x600 piksel ölçülü rəngli çərçivələrin ardıcıllığı.
Burada və aşağıda, fps-i (saniyədə kadr) qiymətləndirmək üçün proqramın 10 qaçışı üzərindəki orta əməliyyat müddətindən istifadə etdik. Bu halda, yalnız təsvirin emal vaxtı nəzərə alındı, çünki indi biz qeydə alınmış video ilə işləyirdik və şəkillər sadəcə bir fayldan yüklənirdi, lakin real sistemdə onlar, məsələn, kameradan gələ bilərdi. Məlum oldu ki, aşkarlama çox layiqli sürətlə işləyir, Elbrus-4C-də 15,5 kadr, Elbrus-8C-də isə 35,6 fps istehsal edir. Elbrus-8C-də, bütün nüvələr zirvədə istifadə olunsa da, prosessor yükü tam deyil. Aydındır ki, bu, bu problemdə bütün hesablamaların paralel aparılmaması ilə bağlıdır. Məsələn, Viola-Jones detektorundan istifadə etməzdən əvvəl biz hər bir kadrda kifayət qədər ağır çəkili köməkçi çevrilmələr həyata keçiririk və sistemin bu hissəsi ardıcıl olaraq işləyir.


İndi nümayiş zamanıdır. Tətbiq interfeysi və göstərilməsi standart Qt5 alətlərindən istifadə etməklə həyata keçirilir. Əlavə optimallaşdırma aparılmadı.


Elbrus-4S



Elbrus-8S


Vizual lokalizasiya

Bu proqramda biz xüsusiyyət nöqtələrinə əsaslanan vizual lokalizasiyanı nümayiş etdirmək qərarına gəldik. GPS izləmə ilə Google Küçə Görünüşü panoramalarından istifadə edərək, sistemimizə kameranın GPS koordinatları və ya digər xarici məlumatlar haqqında məlumatlardan istifadə etmədən onun yerini tanımağı öyrətdik. Belə sistem dronlar və robotlar üçün ehtiyat naviqasiya sistemi kimi, cari yeri aydınlaşdırmaq və ya GPS olmayan sistemlərdə işləmək üçün istifadə oluna bilər.


Əvvəlcə GPS koordinatları ilə panoramaların məlumat bazasını emal etdik. Moskva küçələrinin təxminən 0,4 km^2 sahəsini əhatə edən 660 şəkil çəkdik:




Daha sonra xüsusiyyət nöqtələrindən istifadə edərək şəkillərin təsvirini yaratdıq. Hər bir şəkil üçün biz:

  1. Biz YAPE (Yet Another Point Detector) alqoritmindən istifadə edərək 3 kadr şkalası üçün xüsusi nöqtələr tapdıq (çərçivənin özü, çərçivə 4/3 dəfə kiçildilmiş çərçivə və yarım azaldılmış çərçivə) onlar üçün hesablanmış RFD deskriptorları.
  2. Biz onun koordinatlarını, xüsusi nöqtələr dəstini və onların deskriptorlarını saxladıq. Daha sonra cari çərçivənin xüsusiyyət nöqtələrinin deskriptorlarını verilənlər bazamızdakı deskriptorların dəyərləri ilə müqayisə edəcəyimiz üçün, Hamming məsafəsini metrik olaraq istifadə edərək təsviri ağacda saxlamaq rahatdır. Saxlanan məlumatların ümumi ölçüsü 15 MB-dan bir qədər çox oldu.

Bununla hazırlıqlar tamamlandı, indi proqramın işləməsi zamanı birbaşa baş verənlərə keçək:

  1. Rəngli təsviri boz rəngə çevirir.
  2. Avtomatik kontrastın həyata keçirilməsi.
  3. YAPE alqoritmindən istifadə edərək üç çərçivə miqyası (həmçinin 1, 0,75 və 0,5 əmsalları ilə) üçün xüsusi nöqtələri axtarın və onlar üçün RFD deskriptorlarını hesablayın. Bu alqoritmlər qismən paralelləşdirilir, lakin hesablamaların kifayət qədər böyük hissəsi ardıcıl olaraq qalır. Bundan əlavə, onlar hələ Elbrus platforması üçün optimallaşdırılmayıb.
  4. Yaranan deskriptorlar toplusu üçün ağacda saxlanılanlar arasında oxşar deskriptorlar üçün axtarış aparılır və ən oxşar çərçivələrdən bir neçəsi müəyyən edilir. Müxtəlif deskriptorlar üçün ağac axtarışı tbb istifadə edərək paralelləşdirilir. Bu zaman videonun ilk 5 kadrı üçün ən yaxın 10 kadrı seçirik, sonra isə yalnız 5 kadr götürürük.
  5. Avtomobilin trayektoriyası adətən davamlı olduğundan, seçilmiş çərçivələr “kənar nöqtələri” aradan qaldırmaq üçün əlavə filtrasiyadan keçir.

Giriş məlumatları: 800x600 piksel ölçülü rəngli çərçivələrin ardıcıllığı.

1.71 Pasport, istənilən yerdə rejim, s/kadr, tam prosessor yükü 1.38 0.43 3.2 Pasport, web kamera rejimi, c/frame, tam prosessor yükü 0.47 0.19 2.5

Pasportun tanınması üçün nəticələr olduqca təvazökar idi, çünki hazırkı formada tətbiqimiz 4-dən çox ipdən səmərəli istifadə edə bilməz. Vəziyyət avtomobilin aşkarlanması və vizual yerləşməsi ilə də oxşardır: alqoritmlər paralel olmayan bölmələrə malikdir, ona görə də nüvələrin sayı artdıqca xətti miqyaslılığı gözləmək olmaz. Bununla belə, bütün prosessor nüvələrini yükləyən proqramlar üçün heç bir məhdudiyyət olmadığı halda biz 3,2 dəfə artım müşahidə edirik ki, bu da nəzəri həddi 3,6 dəfəyə yaxındır. Orta hesabla, tapşırıqlar dəstimizdə MCST prosessorlarının nəsilləri arasında performans fərqi təxminən 2-3 dəfədir və bu, çox sevindiricidir. Sadəcə tezliyi artırmaq və arxitekturanı təkmilləşdirməklə biz 1,7 dəfədən çox qazanc görürük. MCST tez bir zamanda Intel-in ildə 5% əlavə etmək strategiyasına çatır.


Tam yük altında sınaqlar zamanı donma və ya çökmə ilə bağlı heç bir problem yaşamadıq ki, bu da prosessor arxitekturasının yetkinliyini göstərir. Elbrus-8C-də hazırlanmış VLIW yanaşması müxtəlif kompüter görmə alqoritmlərinin real vaxt rejimində işləməsinə nail olmağa imkan verir və EML kitabxanasında kodu optimallaşdırmaq niyyətində olmayanlar üçün vaxta qənaət edən çox möhkəm riyazi funksiyalar dəsti var. özləri. Yekun olaraq, bir Elbrus-8C prosessorunda eyni anda 3 demo (lokallaşdırma, avtomobil axtarışı və üz axtarışı) işlədən və təxminən 80% orta prosessor yükü əldə edərək başqa bir təcrübə keçirdik. Burada şərh yoxdur.



Elbrus-8S-i sınamaq fürsətinə görə şirkətə və MCST və INEUM Brook işçilərinə böyük təşəkkürümüzü bildirmək və onları təbrik etmək istərdik - səkkiz daha layiqli prosessordur və onlara uğurlar arzulayırıq!

İstifadə olunan mənbələr

P. Viola, M. Jones, “Sadə Xüsusiyyətlərin Gücləndirilmiş Kaskadından istifadə edərək Sürətli Obyekt Təsbiti”, CVPR 2001-ci il materialları.
B. Fan, Q. Kong, T. Trzcinski, Z. H. Wang, C. Pan və P. Fua, "İkili xüsusiyyət təsviri üçün qəbuledici sahələrin seçimi," IEEE Trans. Şəkil prosesi., s. 2583–2595, 2014.

25.05.2017, Cümə axşamı, 11:45, Moskva vaxtı ilə , Mətn: Vladimir Baxur

Rostec yerli 8 nüvəli 64 bitlik Elbrus 8C prosessorlarına əsaslanan fərdi kompüter və serverlərin ilk nümunələrini nümayiş etdirdi. Yeni çiplərdə ilk serverlərin quraşdırılması partiyaları 2017-ci ilin sonuna qədər gözlənilir.

İşləyən kompüterlərin və serverlərin ilk nümunələri

Ruselectronics birləşmiş holdinqi (Rostec-in bir hissəsi) İnnopolisdə (Tatarıstan) keçirilən CIPR 2017 konfransında Elbrus-8S mikroprosessorları əsasında fərdi kompüterlərin və serverlərin ilk nümunələrini təqdim etdi. Yeni yerli texnologiya, tərtibatçıların fikrincə, performansı artırdı və istifadəçilərə yüksək səviyyədə informasiya təhlükəsizliyinə zəmanət verir. Yeni serverlər real vaxt da daxil olmaqla böyük həcmli məlumatların emal edilməsi üçün nəzərdə tutulub.

Elbrus-8C çipləri əsasında informasiya təhlükəsizliyinə tələbləri artıran dövlət orqanları və biznes strukturları üçün serverlərin, iş stansiyalarının və digər kompüter avadanlığının kütləvi istehsalının təşkili, eləcə də yüksək məhsuldar hesablama sahəsində istifadə üçün nəzərdə tutulub. siqnal emalı və telekommunikasiya.

“Bu, yerli kompüter texnologiyasının yeni nəslidir. Montajın bütün mərhələləri istehsal sahələrimizdə və yerli tərəfdaşların müəssisələrində həyata keçirilir. Bütün bunlar avadanlığın yüksək səviyyədə informasiya təhlükəsizliyinə zəmanət verir”, - “Ruselectronics”in baş direktorunun müavini bildirib. Arseni Brykin. -- Yeni prosessor əsasında fərdi kompüterlərin ilk pilot partiyasının 2017-ci ilin ikinci rübünün sonunadək hazır olacağını gözləyirik. Biz bu gün İnnopolisdə keçirilən CIPR konfransında yeni avadanlıq nümunələrini təqdim edirik”.

4 prosessorlu server sistemində Elbrus-8C çipləri

Birləşmiş Ruselectronics-in bir hissəsi olaraq Elbrus proqram və aparat platformalarının hazırlanması və tətbiqi Elektron İdarəetmə Maşınları İnstitutu (INEUM) tərəfindən həyata keçirilir. I. S. Brook. Elbrus-8S prosessorunun hazırlanması və istehsalı MCST şirkəti tərəfindən həyata keçirilir. Laboratoriya təcrübələri üçün Elbrus-8C prosessorlarının ilk nümunələri 2014-cü ilin sonunda qəbul edilib. Prosessorların kütləvi istehsalı 28 nanometrlik texnoloji prosesin standartlarına uyğun olaraq həyata keçiriləcək.

Ruselectronics-in məlumatına görə, Elbrus-8S bazasında 2 və 4 prosessorlu serverlərin quraşdırılması partiyası 2017-ci ilin sonunadək buraxılacaq.

Texniki detallar

Universal mikroprosessorlar "Elbrus-8S" tamamilə rus istehsalıdır. Hər bir prosessor çipində üçüncü nəsil təkmilləşdirilmiş 64-bit Elbrus arxitekturasına malik 8 prosessor nüvəsi, ümumi tutumu 4 MB (8 x 512 KB) olan L2 keş və 16 MB tutumlu L3 yaddaş yaddaşı var.

Elbrus arxitekturasının xüsusiyyətləri bir maşın dövrəsində hər nüvədə 25-ə qədər əməliyyat yerinə yetirmək imkanı deməkdir ki, bu da orta saat tezliyində yüksək performans təmin edir. Çiplər x86 ikili kodlarda, o cümlədən çox yivli rejimdə paylanmış proqramların və əməliyyat sistemlərinin icrasına imkan verən dinamik ikili tərcümə texnologiyasını dəstəkləyir.

Elbrus-8S prosessorunun arxitekturası

Elbrus-8S prosessorları yaddaş strukturunun bütövlüyünə xüsusi aparat nəzarəti ilə təhlükəsiz hesablama rejimini dəstəkləyir ki, bu da ondan istifadə edən proqram sistemlərinin informasiya təhlükəsizliyini yüksək səviyyədə təmin etməyə imkan verir.

Elbrus-8C prosessorlarının işləmə tezliyi 1,3 GHz, hesablama gücü tək dəqiqlikli əməliyyatlarda (FP32) hər çip üçün təxminən 250 gigaflops təşkil edir.

4 nüvəli Elbrus-4C prosessorları ilə müqayisədə yeni Elbrus-8C prosessor çiplərinin pik performansı, tərtibatçıların fikrincə, 3-5 dəfə, giriş/çıxış kanallarının ötürmə qabiliyyəti isə 8 dəfə yüksəkdir.

Prosessor "Elbrus-8S"

Elbrus-8C prosessorları ECC dəstəyi ilə DDR3-1600 yaddaşla işləmək üçün nəzərdə tutulmuşdur (4 yaddaş nəzarətçisinə qədər). Sistemdə 4 prosessoru dəstəkləyən çoxprosessorlu sistemləri təşkil etmək mümkündür; Keş uyğunluğunu dəstəkləmək üçün snooping filtrasiyası həyata keçirilir. Prosessorlararası mübadilə üçün hər birinin bant genişliyi 16 GB/s (hər istiqamətdə 8 GB/s) olan 3 dupleks kanal mövcuddur.

Elbrus-8S prosessorları periferik interfeys nəzarətçisinə (“cənub körpüsü” KPI-2) uyğun gəlir. KPI-2 çipləri PCI-Express 2.0 avtobusunu (PCI-Express 16 + 4 zolaqlı), 3 Gigabit Ethernet portunu, 8-ə qədər SATA 3.0 cihazı, 8-ə qədər USB 2.0 portu, PCI 32/66 avtobusunda 7 cihazı dəstəkləyir. , həmçinin IDE, Audio HDA, RS-232, IEEE1284, SPI, I2C və GPIO interfeysləri.

Elbrus-8S platforması x86/x86-64 ikili kodları olan binar uyğunluq sisteminə malikdir. Avadanlıqların özünü diaqnostikası üçün tətbiqi proqram təminatı və testlər hazırlamaq da mümkündür.

Elbrus platforması üçün əsas əməliyyat sistemi Linux nüvəsinə əsaslanan Elbrus ƏS-dir. Platforma proqramlaşdırma sistemi C, C++, Java, Fortran-77, Fortran-90 dillərini dəstəkləyir.

yoldaş krom63İnternetdə "Hesablama qaz dinamikasının superkompüter tətbiqlərində Elbrus-8C prosessorunun performansı" sənədini tapdım və ona ixbt.com saytının tematik forumunda bir keçid paylaşdım.

Məqalədə Elbrus-801 kompüterinin bir hissəsi kimi Elbrus-8C prosessorunun Intel və AMD mikroprosessorları ilə müqayisədə sınaq nəticələri təqdim olunur.

Sınaq strukturlaşdırılmamış hibrid şəbəkələrdə qaz dinamikasının və aeroakustika problemlərinin burulğanla üçölçülü modelləşdirilməsi üçün nəzərdə tutulmuş proqram təminatı sistemlərindən istifadə etməklə aparılmışdır.

(məqalə qısaldılmışdır, məqalənin tam versiyası aşağıdakı linkdədir)

NOISETte proqram paketi

NOISETte-nin əsas tətbiq sahəsi aerodinamikanın və aeroakustika problemlərinin superkompüter simulyasiyasıdır, əsasən aerokosmik sənayedə rast gəlinir.

Tapir proqram paketi

Özlü sıxıla bilən qazın səssiz və səssiz axınlarını hesablamaq üçün nəzərdə tutulmuşdur. Navier-Stokes tənliklərinin diskretləşdirilməsi hibrid struktursuz şəbəkənin elementlərinin kütlə mərkəzlərində şəbəkə funksiyalarının qiymətlərinin təyini ilə sonlu həcm metodu əsasında aparılır.

Elbrus-8S prosessor arxitekturasının xüsusiyyətləri

Səkkiz nüvəli Elbrus-8C prosessoru VLIW memarlıq ailəsinə aiddir. Hər bir nüvə bir saat dövrəsində 25-ə qədər müxtəlif elementar əməliyyatı yerinə yetirə bilər. Geniş komandanın strukturu (WT) sizə yerləşdirməyə imkan verir:

1 idarəetmə ötürmə əmri: tullanmaq, zəng etmək, qayıtmaq;

3 predikat məntiq əmri;

6 arifmetik-məntiqi əməliyyata qədər: tam, bit, sürüşmə və real arifmetik (birləşdirilmiş daxil olmaqla), yaddaşa girişlər, müqayisələr, köçürmələr və üçlü operatorlar;

Müvafiq göstəricinin artırılması da daxil olmaqla, xətti müntəzəm məlumatlara daxil olmaq üçün 4 əmr;

1 dövrə sayğacına nəzarət əmri;

16 bayt daimi məlumat;

Pəncərə idarəetmə əmrlərini qeyd edin.

Həqiqi arifmetika üçün fmul*, fadd*/fsub*, birləşdirilmiş (iki əməliyyatdan ibarət) fmul_add*/sub* funksiyalarının yerinə yetirilməsinə və tamamlanmasına imkan verən FP32 və FP64 formatında tam boru xəttli vurma və toplama cihazları olan 6 arifmetik məntiq vahidi mövcuddur. /rsub* hər vuruş.

Həmçinin, fdiv*, fsqrt* əməliyyatlarından birinə hər 2 saat dövründən bir işləməyə imkan verən bir qismən boru kəməri ilə təchiz edilmiş bölmə və kvadrat kök cihazı mövcuddur. Memarlığın daha ətraflı təsviri təqdim olunur.

4 DDR3 1600 kanalı olan yaddaş alt sistemi 51,2 GB/s maksimum iş sürətini təmin edir. Keş iyerarxiyası təqdim olunur

Hər nüvə üçün 1-ci səviyyəli məlumat keşi, 64 KB, 4 yollu;

Hər nüvə üçün 1-ci səviyyə təlimat keşi, 128 KB, 4 yollu;

Hər nüvə üçün L2 keş, 512 KB, 4 yollu;

8 nüvə, 16 MB, 16 yol üçün inklüziv paylaşılan üçüncü səviyyəli keş.

Prosessorlar 4 prosessordan ibarət NUMA sisteminə birləşdirilə bilər ki, onlar arasında hər bir istiqamətdə 8 GB/s-ə qədər ötürmə qabiliyyətinə malik bağlantılar istifadə olunur.

Müqayisəli sınaq üçün Elbrus-8C prosessorunun bir neçə Qərb analoqu seçilmişdir. Onların arasında oxşar xüsusiyyətlərə malik, eyni zamanda DDR3 yaddaşla işləyən və 22 nm və ya daha çox proses texnologiyasından istifadə etməklə hazırlanmış iki prosessor var: AMD Opteron 6276, Interlagos nüvəsi; Intel Xeon E5-2650v2, Ivy Bridge nüvəsi. Hazırda DDR4 yaddaşı ilə işləyən və 14 nm proses texnologiyasından istifadə etməklə hazırlanmış ən müasir Intel prosessorları da var: Intel Xeon E5-2683v4, Broadwell nüvəsi və Intel Xeon Platinum 8160, Skylake nüvəsi. Cədvəl 3-də nüvələrin sayı, saat tezliyi (GHz), pik performans (GFLOPS), yaddaş bant genişliyi (GB/s), enerji istehlakı (W), proses texnologiyası (nm) göstərilir.

Paralel sürətlənmə.

Bu ölçü, OpenMP paralelləşdirmə ilə çox yivli rejimdə çox nüvəli prosessorda hesablamanın eyni prosessorda ardıcıl icraya nisbətən neçə dəfə sürətləndirildiyini göstərir. 8 nüvə üzrə sürətlənmənin nəticələri Cədvəl 4-də təqdim edilmişdir. Elbrus-8C prosessorunda 5-6 dəfə sürətlənmə, ümumiyyətlə, Qərb analoqlarına yaxşı uyğun gəlir. Əksər prosessorlar üçün yaddaşın genişliyi (SpMV, Grad) ilə məhdudlaşan, aşağı hesablama intensivliyi ilə əməliyyatların zəif sürətləndirilməsini qeyd edə bilərik. Eyni zamanda, Skylake 6 DDR4 kanalı olan daha güclü yaddaş alt sistemi sayəsində bütün əməliyyatlarda eyni dərəcədə yüksək sürətlənmə nümayiş etdirir.


Tək nüvəli müqayisə.

Bu test ardıcıl rejimdə hesablama performansını müqayisə edir. Cədvəl 5-də təqdim olunan nəticələr, işləmə sürəti bir kimi qəbul edilən Elbrus-8C prosessoru ilə performans nisbətini göstərir. NOISETte kodunda Intel prosessorları ilə fərq təxminən 3 dəfə idi. Saat başına performans baxımından bu, təxminən bir yarım dəfə fərqə uyğundur (çünki Intel prosessorları təxminən iki dəfə tezliyə malikdir). AMD ilə müqayisədə itki təxminən 1,4 dəfə olub. Qeyd etmək lazımdır ki, NOISETte Tapirdən (təxminən min sətirdən) əhəmiyyətli dərəcədə daha mürəkkəb icra və əməliyyat məntiqinə malikdir (hesablama hissəsi on minlərlə sətirdir). Əksər resurs tələb edən NOISETte əməliyyatları üçün Elbrus arxitekturasına xüsusi uyğunlaşma həyata keçirilməmişdir. Tapir üçün, yuxarıda 3-cü Bölmədə təsvir edilən hesablamaların Elbrus arxitekturasına nisbətən sadə uyğunlaşdırılması həyata keçirildi. Tapir kodunda Intel ilə fərq cəmi bir yarım dəfə idi. Beləliklə, bu tətbiqdə Elbrus-8S Intel analoqlarından daha yüksək performans nümayiş etdirir. AMD nüvəsinin Elbrusdan təxminən bir yarım dəfə yavaş olduğu ortaya çıxdı.


8 nüvədə performans müqayisəsi.

Bu test Elbrus-8S ilə eyni sayda nüvələrdə çox yivli rejimdə hesablama performansını müqayisə edir. Paralel rejimdə, yaddaş alt sisteminin performansı artıq nəticəyə əhəmiyyətli dərəcədə təsir göstərir, çünki 8 ip yaddaşın genişliyini tamamilə tükəndirə bilər. Elbrusla əlaqənin nəticələri Cədvəl 6-da göstərilmişdir. Cədvəl 5 ilə müqayisədə NOISETte kodunda nisbətin Elbrusun xeyrinə dəyişdiyini qeyd etmək olar. Bu testdə Elbrus hər iki kodda AMD-dən üstündür. Tapir kodu üçün Intel ilə fərq təxminən 2 dəfə idi.


Bütün prosessorun müqayisəsi.

Bu test bütün prosessor nüvələrində çox yivli hesablama performansını müqayisə edir. Nəticələr Cədvəl 7-də göstərilmişdir.

AMD prosessoru Intel-dən nəzərəçarpacaq dərəcədə zəif görünür. 8 nüvəli Elbrus-8S Tapir kodunda bu 16 nüvəli prosessoru üstələyir. Yüksək OpenMP sürətləndirilməsi sayəsində 16 və 24 nüvəli Intel prosessorları 8 nüvəli ilə müqayisədə nəzərəçarpacaq dərəcədə artdı; Elbrus ilə fərq artıq təxminən 3-7 dəfə idi.


Hesablama performansı.

Faktiki performansı ölçmək üçün Tapir kodundakı arifmetik əməliyyatların sayı hesablanmışdır. Həmçinin, yaddaş ötürmə qabiliyyəti ilə ciddi şəkildə məhdudlaşan əməliyyatın nümunəsi olaraq, nəzərə alınanlar arasında ən aşağı hesablama intensivliyinə malik olan NOISETte SpMV əməliyyatı seçildi - bayta təxminən 0,2 FLOP, bu Tapir kodundan təxminən 10 dəfə aşağıdır. Nəticələr Cədvəl 8-də təqdim olunur, bu da cihazların nəzəri zirvəsinin faizini göstərir.


Nəticələrdən aydın olur ki, SpMV-də pikin nəzərəçarpacaq dərəcədə kiçik bir faizi əldə edilir, çünki prosessorlarda arifmetik əməliyyatların sayındakı pik yaddaşın ötürmə qabiliyyətindən dəfələrlə böyükdür. Performans və məhsuldarlıq arasındakı əlaqəni Cədvəl 3-də qiymətləndirmək olar.

Sələfi Broadwell ilə müqayisədə saat başına əməliyyatların sayı dörd dəfə çox olan Skylake-in aşağı pik faizini də qeyd edə bilərsiniz. Belə nəticəyə gəlmək olar ki, nəzərdən keçirilən alqoritmlərin növü üçün, əsasən, yaddaş ötürmə qabiliyyətinin məhdudlaşdırılması səbəbindən vektor arifmetik cihazlarının sayının iki dəfə artırılması və vektor registrlərinin ikiqat artırılması performans artımını təmin etməmişdir.

Nəticə

Çoxnüvəli Elbrus8S prosessorlarında hesablama performansı hesablama qaz dinamikasının real həyat tətbiqlərindən istifadə etməklə tədqiq edilmişdir. Strukturlaşdırılmamış şəbəkələrdə sıxıla bilən axınların modelləşdirilməsi üçün iki proqram paketi istifadə edilmişdir, NOISETte və Tapir.

Intel Xeon prosessorlarının 5 il əvvəlki modellərdən ən müasirinə qədər bir neçə modeli nəzərdən keçirilmişdir. Möcüzələr, əlbəttə ki, baş vermir; Elbrus, gözlənildiyi kimi, Intel prosessorlarından daha yavaş olduğu ortaya çıxdı. Nüvə performansındakı itki NOISETte kodu üçün orta hesabla 2,6 dəfə, Tapir kodu üçün isə 1,5 dəfə olmuşdur. Elbrus-8S-in saat tezliyinin təxminən yarısı aşağı olduğunu nəzərə alsaq, bu, kifayət qədər yaxşı nəticə kimi görünür, yəni saat dövrü baxımından Elbrus Intel-dən geri qalmır. Bundan əlavə, bu sinif proqramlarda təxminən iki dəfə itki hətta Intel-in əsas rəqibi olan AMD prosessorları üçün xarakterikdir. Bütün prosessorun performansı baxımından NOISETte kodunda Intel-ə nisbətən itki 8 nüvəli Ivy Bridge ilə müqayisədə 2,5 dəfədən 24 nüvəli Skylake ilə müqayisədə 6,8 dəfə, Tapir kodunda isə 2 ilə 5 dəfə arasında dəyişdi. , müvafiq olaraq.

Müqayisə üçün təxminən 5 il əvvələ aid 16 nüvəli AMD Opteron 6276 prosessorunu araşdırdıq. Bu prosessor müvafiq 8 nüvəli Intel Ivy Bridge-i təxminən 2 dəfə üstələdi. NOISETte kodunda, 1,3 GHz tezliyi olan 8 nüvəli Elbrus-8C, 2,3 GHz tezliyi olan 16 nüvəli AMD prosessorundan cəmi 1,4 dəfə yavaş olduğu ortaya çıxdı və Tapir kodunda Elbrus AMD-ni üstələyib. 12%.

Onu da qeyd etmək lazımdır ki, Intel prosessorları bu tip tətbiqlərdə əsas performansda artım göstərmir. Üstəlik, müasir Intel Skylake nüvəsi 5 il əvvəlki Intel Ivy Bridge nüvəsindən 20% daha yavaş olduğu ortaya çıxdı. Vektor registrlərinin genişləndirilməsi və arifmetik vahidlərin sayının iki dəfə artırılması (yalnız kompilyatorun avtomatik vektorlaşdırma alətlərindən istifadə etməklə) məhdud yaddaş ötürmə qabiliyyətinə görə performans artımını təmin etmədi. Müasir prosessorların məhsuldarlığının artması əsasən nüvələrin sayının artması ilə bağlıdır.

Eyni zamanda, əvvəlki nəsil Elbrus-4C ilə müqayisədə Elbrus-8C prosessorunun əsas performansı təxminən bir yarım dəfə artıb. Bu, ümid etməyə imkan verir ki, növbəti nəsil Elbrus-16C prosessorlarının buraxılması ilə boşluq daha da azalacaq. 2022-ci ildə buraxılması planlaşdırılan növbəti modelin 2 GHz tezliyində işləyən 16 nüvəyə sahib olacağı gözlənilir. Onun 4 kanaldan 8 kanala qədər DDR4-2666 yaddaşından istifadə edəcəyi gözlənilir ki, bu da yaddaş alt sisteminin ötürmə qabiliyyətini 3 dəfədən çox artıra bilər. Həmçinin, optimallaşdırıcı kompilyatorun daha da təkmilləşdirilməsi məhsuldarlığın artmasına əhəmiyyətli töhfə verə bilər.

28 nm texnoloji texnologiya ilə istehsal edilən səkkiz nüvəli Elbrus-8S prosessoru “İT hərbi sənaye kompleksinin xidmətində” adlı dördüncü konfransda təqdim olunub. Hərbi-sənaye kompleksinin tərtibatçılarını və İT mütəxəssislərini bir araya gətirən ən böyük ixtisaslaşmış tədbir dünən İnnopolisdə (Tatarıstan Respublikası) başlayıb və mayın 29-dək davam edəcək.

Rusiya üçün yeni texnoloji prosesdən istifadə etməklə yerli mikroprosessorun yaradılması üzrə işlərin yekun mərhələsini Rostec-in tərkibində olan Birləşmiş Cihazqayırma Korporasiyasının baş direktoru Aleksandr Yakunin elan edib.

“T-Platforms” şirkəti ilə birgə həyata keçirdiyimiz “Baykal” layihəsi çərçivəsində sıçrayışlı nəticə əldə olundu”, – Aleksandr Yakunin izah etdi. – Rusiya üçün inqilabi olan 28 nm proses texnologiyalı Baykal-T prosessorunun ilk mühəndislik nümunəsi yeni buraxıldı.

Rusiyanın növbəti inkişafı eyni texniki prosesə əsaslanan yeni nəsil Elbrus prosessorları olacaq. Onun yaradılması son mərhələyə çatıb, növbəti mühəndis buraxılışı hazırda sınaqdan keçirilir”.

Elbrus-8S-in hazırlanması MCST şirkətinin iştirakı ilə İ.S.Bruk adına Elektron İdarəetmə Maşınları İnstitutu (INEUM) tərəfindən həyata keçirilir. Onun xüsusiyyətləri belə görünür:

  • kristal sahəsi 350 kv. mm;
  • hyperthreading olmadan səkkiz eyni prosessor nüvəsi;
  • Hər nüvə üçün 512 KB L2 keş;
  • üçüncü səviyyəli keş – paylaşılan, 16 MB;
  • "MCST" ASC-də hazırlanmış "Elbrus" öz memarlığı;
  • vektor sürətləndiriciləri və riyazi hesablamaları, şifrələməni və siqnalın işlənməsini sürətləndirmək üçün təlimatları olan komanda sistemi. Onlar ayrı-ayrı uzantılara ayrılmır, lakin ilkin olaraq verilir;
  • optimallaşdıran ikili kod tərcümə sistemi x86 / x86-64 arxitekturaları ilə uyğunluğu təmin edir, eyni zamanda Intel-dən müstəqil lisenziya alır və yerli 80% performansa nail olur;
  • iyirmi OS paylamasında və mindən çox populyar proqramda ikili tərcümə olmadan birbaşa əmrləri yerinə yetirmək imkanı (siyahı sürətlə böyüyür);
  • zərərli kodun icrasından qorunmaq üçün daxili mexanizmlər: deskriptorlar vasitəsilə obyektlərə çıxışı olan strukturlaşdırılmış yaddaş və dil əhatə dairəsinə əsaslanan kontekstual mühafizə; obyekt sərhədlərinin pozulmasının (bufer daşması), işə salınmamış məlumatlardan istifadənin və proqramlaşdırma standartlarından təhlükəli kənarlaşmaların aşkar edilməsi.
  • PC3‑12800 standartının dörd yaddaş yuvası üçün dəstək (DIMM DDR3-1600);
  • dövr başına 30 əməliyyatın yerinə yetirilməsi;
  • 1,3 GHz takt tezliyi planlaşdırılmış tezlik tavanıdır, bu zaman bütün səkkiz nüvənin 100% yüklənməsi standart şərtlər altında qeyri-məhdud müddətə mümkündür. Əlverişsiz (və xüsusilə sahə) iş şəraitində işləmək, həddindən artıq istiləşmədən qorunmaq üçün əməliyyat sistemindən istifadə edərək fərdi nüvələrin avtomatik tezliyinin azaldılması sxemi (boşaltma ilə analoq) və (müvəqqəti) proqram təminatı həyata keçiriləcək;
  • bütün FPU-ların tam yüklənməsi ilə tək dəqiqlikli üzən nöqtə hesablamalarında (FP32) 250 Gflops maksimum performans;
  • 60 - 90 Vt səviyyəsində güc itkisi (hesablanmış rəqəmlər);
  • prosessor birbaşa lövhədə lehimlənir, bu da çiplərin qablaşdırılması və onların rədd edilməsinin dəyərini azaldır.

Elbrus-8S yerli istehsal edilmiş periferik interfeys nəzarətçisi - KPI-2 ilə tandemdə işləyəcək.

Hazırda 65 nm proses texnologiyasından istifadə etməklə istehsal edilən bu çip 20 PCI-Express 2.0 avtobus zolağı (8+8+4), üç gigabit Ethernet şəbəkə nəzarətçisi, səkkiz SATA v.3.0 portu və səkkiz USB 2.0 portunu dəstəkləyir. KPI-2 prosessoru ilə məlumat mübadiləsi sürəti 16 GB/s təşkil edir.

Əsas interfeysləri dəstəkləməklə yanaşı, o, enerjiyə qənaət funksiyalarını təmin edən daxili SPMC nəzarətçisini, həmçinin kəsmə nəzarətçisini ehtiva edir.

Aparat öz BIOS mikrokodu vasitəsilə əməliyyat sistemi ilə qarşılıqlı əlaqədə olur. Linux, FreeBSD, QNX, Windows XP paylamaları ilə işləmək mümkündür, lakin kritik proqramlar üçün biz Linux nüvəsi 2.6.33 əsasında Elbrus ƏS-ni tövsiyə edirik. MCST komandası fasilələrin idarə edilməsi, sinxronizasiya, yaddaşın idarə edilməsi və etiketli hesablamalara dəstək üçün öz mexanizmləri ilə real vaxt rejimində ƏS yaratmaq üçün çox iş görmüşdür. Bütün bunlar yerli prosessor arxitekturasının potensialını açmaq və ümumi istismarlardan qorunmaq məqsədi daşıyır.

Elbrus arxitekturasını nəzərə alaraq proqram kodunun optimallaşdırılması xüsusi inkişaf alətlərindən istifadə etməklə əldə edilir: C və C++, Fortran və Java dilləri üçün kompilyatorların optimallaşdırılması, hesablamaları paralelləşdirmək üçün sazlayıcılar, alətlər və kitabxanalar. Sonuncular arasında Message Passing Interface (MPI) və açıq standart OpenMP-dən istifadə etmək mümkündür.


Elbrus prosessorlarının inkişafı.

Elbrus prosessorlarında icra üçün optimallaşdırılmış yardım proqramları və köməkçi komponentlər artıq yaradılır. Bunlar kommunal xidmətlər, xidmətlər, ümumi təyinatlı kitabxanalar, verilənlər bazası dəstəyi, qrafik alt sistemi (Xorg, GTK+ və Qt əsasında), şəbəkə və periferik qurğularla işləmək üçün alətlərdir.

Əsas vəzifə hərbi-sənaye kompleksinin əsas obyektlərində və strateji əhəmiyyətli Rusiya infrastruktur obyektlərində idxalı əvəz etməkdir. Computerra artıq aşkarlanması olduqca çətin olan Ivy Bridge arxitekturasına malik Intel prosessorlarında aparat səviyyəli troyan yaratmağın texniki imkanlarından danışır. Tədqiqatçıların bu işi Massaçusets Universitetində aparılıb və konsepsiyanın sübutu kimi yerləşdirilib - oxşar əlfəcinlər digər prosessorlarda da yaradıla bilər.

"Xarici əsas komponentlərlə texnologiyadan istifadə ölkə üçün vacib olan idarəetmə və istehsal sahələrində böyük təhlükələr yaradır" deyə Aleksandr Yakunin qeyd edir. "İlk növbədə, məlumatların qorunması və avadanlıqların işinə kənardan təsir göstərməyin gizli imkanları baxımından."

Elbrus-8C prosessorunun dövlət sınaqları bu ilin sonuna planlaşdırılır. Əgər onlar uğur qazansa, 2016-cı ildə seriyalı istehsala başlanılacaq. İndiyə qədər biz ildə təxminən 50 min prosessor səviyyəsində kiçik miqyaslı istehsaldan daha çox danışırıq, lakin bu, Rusiya mikroelektronikası üçün artıq böyük bir addımdır.

“Bu ilin sonu və ya gələn ilin əvvəlində T-Platformalar yeni Baikal-M prosessoru üzərində işləri başa çatdırmalıdır və 2018-ci ildə biz eyni 28 Nm texnologiyası üzrə 1,5 tezliyə malik Elbrus-16S-ni təqdim etməyi planlaşdırırıq. GHz və 512 GFlops-dan çox performans," Aleksandr Yakunin yaxın planlarını dilə gətirir. Artıq məlumdur ki, növbəti Elbrus prosessoru hər taktda 50 əməliyyat yerinə yetirəcək. Onun təxmin edilən məhsuldarlığı Elbrus-8S-dən 2,5 dəfə yüksək olacaq.

Məqalədə JSC United Instrument-Making Corporation-ın materiallarından istifadə olunur.