নতুন পরিবার আর্ম সি১ কোর মোবাইল এবং আল্ট্রাপোর্টেবল ডিভাইস ইকোসিস্টেমে একটি বড় পরিবর্তনের চিহ্ন, যা পরিচিত কর্টেক্সকে প্রতিস্থাপন করে টেকসই কর্মক্ষমতা এবং দক্ষতার উপর স্পষ্ট মনোযোগ দেয়। এই প্রজন্মটি নিয়ে আসে লুমেক্স প্ল্যাটফর্ম এবং একটি স্পষ্ট উদ্দেশ্য নিয়ে: ব্যাটারি বা তাপমাত্রার সাথে আপস না করেই ডিভাইসে AI ত্বরান্বিত করা।
নাম পরিবর্তনের বাইরেও, প্রস্তাবটি একত্রিত করে Armv9.3-A স্থাপত্য, মেমরি সাবসিস্টেমের একটি গভীর পুনর্গঠন, এবং ম্যাট্রিক্স কম্পিউটিং ক্ষমতার একটি উল্লেখযোগ্য বৃদ্ধি। ফলাফল হল কম বিদ্যুৎ খরচের সাথে ব্যাপক কর্মক্ষমতা উন্নতি, সেইসাথে স্মার্টফোন, ট্যাবলেট, ল্যাপটপ এবং পরিধেয় ডিভাইসের জন্য ডিজাইন করা একটি রোডম্যাপ।
আর্ম সি১ কোরের স্থাপত্য এবং নতুন বৈশিষ্ট্য

C1 সিরিজটি চারটি রূপে সংগঠিত: C1-আল্ট্রা (সর্বোচ্চ কর্মক্ষমতা), C1-প্রিমিয়াম (কম এলাকায় উচ্চ কর্মক্ষমতা), C1-প্রো (ভারসাম্য) এবং C1-ন্যানো (সর্বোচ্চ দক্ষতা)। প্রতিটি প্রস্তুতকারক এই ব্লকগুলিকে ভিন্ন ভিন্ন ক্লাস্টারে একত্রিত করে বিভিন্ন পরিসর এবং ব্যবহারের জন্য অভিযোজিত SoC তৈরি করতে পারে, যার কনফিগারেশন রয়েছে 14 কোর পর্যন্ত.
আর্ম ফ্রন্ট- এবং ব্যাক-এন্ড উভয় ক্ষেত্রেই পরিবর্তন এনেছে, যার মধ্যে রয়েছে ভবিষ্যদ্বাণী, ক্যাশে এবং আউট-অফ-অর্ডার এক্সিকিউশনের উন্নতি। নতুন ইন্টারকানেক্ট এবং আরও দক্ষ (ডেটা-ইনটেনসিভ) শেয়ার্ড ক্যাশের জন্য ধন্যবাদ, এসএলসি কোষ), প্ল্যাটফর্মটি দৈনন্দিন ব্যবহারের ক্ষেত্রে গড়ে প্রায় ১৫% বৃদ্ধি প্রদান করে, যা স্কেল করে ডিমান্ডিং লোডের উপর +30% এবং সর্বোচ্চ শিখরে পৌঁছান মাল্টিকোরে ১৮%.
মেমোরি সাপোর্ট বিকশিত হয় LPDDR6 ৯৬০০ মেট্রিক টন/সেকেন্ড পর্যন্ত গতিতে LPDDR5X এর সাথে সামঞ্জস্য বজায় রেখে বিদ্যুৎ খরচ এবং লেটেন্সি কমাতে। এই মেমোরি বেস, ক্লাস্টার রিডিজাইনের সাথে, তাপীয় চাপের অধীনে টেকসই কর্মক্ষমতা এবং প্রতিক্রিয়াকে শক্তিশালী করে।
C1-আল্ট্রা: কর্মক্ষমতা সিলিং
একটি শীর্ষ-অব-দ্য-রেঞ্জ কোর হিসেবে, C1-আল্ট্রা এটি ফ্ল্যাগশিপ SoC এবং কম্পিউটেশনাল ফটোগ্রাফি, বৃহৎ AI মডেল, অথবা মোবাইল AAA গেমের মতো উচ্চ-চাহিদা সম্পন্ন কাজগুলিকে লক্ষ্য করে তৈরি করছে। Cortex-X925 এর তুলনায়, Arm একটি একক থ্রেডে +২৫%, এমন একটি চিত্র যা ক্লাস্টারে আরও কোরের সাথে মিলিত হলে সামগ্রিক কর্মক্ষমতা স্কেল করতে সাহায্য করে।
ফ্রন্ট-এন্ড ব্যান্ডউইথ উন্নত করে নির্দেশাবলীর L1 এবং ভবিষ্যদ্বাণীর নির্ভুলতা, যখন ব্যাক-এন্ড আউট-অফ-অর্ডার এক্সিকিউশন উইন্ডোকে প্রায় 25% বৃদ্ধি করে, প্রায় পৌঁছে দেয় 2.000 নির্দেশাবলী একই সাথে। এছাড়াও, L1 ডেটা ধারণক্ষমতা দ্বিগুণ করে 128 KB করা হয় এবং L1 পড়ার গতি প্রায় 33% ত্বরান্বিত হয়।
C1-প্রিমিয়াম: কম জায়গায় উচ্চ কর্মক্ষমতা
যেসব প্রিমিয়াম ডিভাইসের সর্বোচ্চ সীমার প্রয়োজন নেই, তাদের জন্য C1-প্রিমিয়াম আল্ট্রার খুব কাছাকাছি একটি স্থাপত্য বজায় রাখে কিন্তু একটি সহ ৩৫% এলাকা হ্রাসএটি কর্মক্ষমতা এবং খরচের ভারসাম্য বজায় রাখার জন্য ডিজাইন করা হয়েছে, উল্লেখযোগ্য অঙ্কের ক্ষতি না করে আরও কমপ্যাক্ট ডিজাইনের সুবিধা প্রদান করে।
C1-প্রো: ভারসাম্য এবং মাল্টি-কোর পেশী
কেন্দ্রীয় অংশে, C1-প্রো কর্টেক্স-এ৭২৫ কে একটি দিয়ে প্রতিস্থাপন করে একই খরচে +১১% দক্ষতা এবং দক্ষতার উন্নতির সাথে যা পৌঁছায় একই পারফরম্যান্সে ২৬% পর্যন্ত কম শক্তিগেমিংয়ে, আর্ম প্রায় + + 16% এই শ্রেণীর নিউক্লিয়াসে।
কীগুলি আরও সক্ষম ফ্রন্ট-এন্ডে রয়েছে (পরিমার্জিত স্ট্যাটিক ভবিষ্যদ্বাণী এবং একটি অনেক বড় BTB) এবং ভবিষ্যদ্বাণী সঠিক হলে L1D তে বেশি ব্যান্ডউইথ এবং L2 তে কম ল্যাটেন্সি সহ একটি ব্যাকএন্ড। বাস্তব-বিশ্বের পরিস্থিতিতে প্রতিক্রিয়া দ্রুত করার জন্য ভবিষ্যদ্বাণীকারীকেও টিউন করা হয়েছে।
C1-ন্যানো: দক্ষতা সর্বোপরি
হালকা কাজের জন্য এবং চরম সাশ্রয়ের জন্য, C1-ন্যানো প্রায় দ্বারা দক্ষতা বৃদ্ধি করে ৮০% পূর্বসূরীর তুলনায় (ক্ষেত্রফল কার্যত অক্ষত রেখে, A2 এর তুলনায় ~+520%)। L1-এ নির্দেশাবলী দ্রুত আনার জন্য এবং ব্যর্থ ভবিষ্যদ্বাণীর জন্য অপেক্ষা কমানোর জন্য ভবিষ্যদ্বাণী এবং আনার পর্যায়গুলিকে আলাদা করা হয়েছে।
উপরন্তু, ভেক্টর প্রক্রিয়াকরণ, পাইপলাইন আটকে গেলে ড্রাইভগুলি বন্ধ হয়ে যায় এবং L3 এবং DRAM এর মধ্যে ট্র্যাফিক হ্রাস পায় (গড়ে প্রায় 21% এবং নির্দিষ্ট লোডের অধীনে 39% পর্যন্ত), যা খরচ কমায় এবং প্রতিক্রিয়া উন্নত করে।
C1-DSU: নমনীয় ক্লাস্টার এবং কম খরচ
নতুন সি১-ডিএসইউ একটি ভাগ করা L3 ক্যাশের অধীনে কোরগুলির সংযোগ পরিচালনা করে এবং বাকি SoC (RAM, GPU, ইত্যাদি) এর সাথে ব্যবধান পূরণ করে। পূর্ববর্তী পুনরাবৃত্তির তুলনায়, নকশাটি সাধারণত সিস্টেমের পাওয়ার খরচ প্রায় কমিয়ে দেয় 11% এবং স্মৃতিশক্তির প্রভাব ~৭%, যেমন মোডের উপর নির্ভর করে L3 কুইক ন্যাপ ব্যবহার না করার সময় ক্ষতি কমাতে।
আরেকটি গুরুত্বপূর্ণ অংশ হল এর একীকরণ SME2 অ্যাক্সিলারেটর কোরের বাইরের উপাদান হিসেবে: C1-Ultra এবং C1-Premium-এ তাদের উপস্থিতি বাধ্যতামূলক, যখন সি১-প্রো এবং সি১-ন্যানো এটি প্রস্তুতকারকের নকশার উপর নির্ভর করে ঐচ্ছিক। ক্লাস্টারের যেকোনো কোর উপস্থিত থাকলে এগুলি অ্যাক্সেস করতে পারে, যা খুব বৈচিত্র্যময় সমন্বয় সক্ষম করে (যেমন, 2× C1‑Ultra + 6× C1‑Pro এক বা দুটি SME2 অ্যাক্সিলারেটর সহ, অথবা Pro এবং Nano মিশ্রিত আরও সাধারণ সমন্বয়)।
লুমেক্স প্ল্যাটফর্মে নতুন প্রজন্মের জিপিইউও অন্তর্ভুক্ত রয়েছে। যদিও এই খবরের কেন্দ্রবিন্দু সিপিইউগুলির উপর, মালি জি 1 গ্রাফিক্স কর্মক্ষমতায় ~২০% উন্নতির সাথে, রশ্মি ট্রেসিংয়ের থ্রুপুট দ্বিগুণ করে এবং প্রতি ফ্রেমে বিদ্যুৎ খরচ প্রায় ৯% কমিয়ে দেয়, যা জিপিইউ-ফার্স্ট গেম এবং এআই ওয়ার্কলোডের জন্য মিশ্রণকে শক্তিশালী করে।
SME2 এবং AI-তে CPU-এর ভূমিকা

AI-তে বড় উল্লম্ফন এসেছে SME2 (স্কেলেবল ম্যাট্রিক্স এক্সটেনশন 2), যা ম্যাট্রিক্স গুণন, বহু-প্রেডিকেট এবং নতুন ডেটা টাইপ (2b/4b এর মতো কম্প্যাক্ট প্রিসিশন সহ) ত্বরান্বিত করে এবং উন্নত ভেক্টরাইজেশনের জন্য SVE2 এর সাথে সমন্বয় করে। সমষ্টিগত সংখ্যায়, Arm সম্পর্কে কথা বলে গড় উন্নতি ৩.৭x খরচ কমে যাওয়ার সাথে সাথে 27%.
ব্যবহারিক ক্ষেত্রে, কোম্পানিটি লেটেন্সি হ্রাস দেখিয়েছে স্পিচ রিকগনিশনে ৪.৭ গুণ (হুইস্পার বেস), ২.৪–২.৮x গতি বৃদ্ধি টেক্সটো a voz এবং LLM (যেমন Gemma 3) এর জন্য টোকেন জেনারেশনে বড় বৃদ্ধি যা কাছাকাছি × 5সিপিইউতে চালানোর ফলে অন্যান্য অ্যাক্সিলারেটরে স্থানান্তর এড়ানো যায়, যা অপেক্ষার সময় কমায় এবং প্রতিক্রিয়াশীলতা প্রদান করে।
ছোট বা ইন্টারেক্টিভ লোডের জন্য, CPU আবার কেন্দ্রবিন্দুতে চলে আসে: এর সাথে SME2 XNUMXঅনেক দৈনন্দিন কাজ (স্থানীয় চিত্র বর্ধন, বিভাজন, শ্রেণিবিন্যাস, ক্যামেরা প্রভাব, বা অডিও) দ্রুত সম্পন্ন হয়, কম ওভারহেডের সাথে এবং নেটওয়ার্কের মধ্য দিয়ে না গিয়ে। চাহিদা বৃদ্ধি পেলে, GPU বা একটি বহিরাগত NPU দায়িত্ব নিতে পারে, কিন্তু CPU আর কোনও বাধা নয়।
সফ্টওয়্যার সহায়তাও পাওয়া যায়: এর মধ্যে ইন্টিগ্রেশন রয়েছে লিনাক্স এবং অ্যান্ড্রয়েড ১৬, অপ্টিমাইজড টুলচেইন এবং লাইব্রেরি (KleidiAI), এবং ইঞ্জিনের সাথে সামঞ্জস্য যেমন ঐক্য এবং অবাস্তব ইঞ্জিনএটি প্রথম বাণিজ্যিক SoC আসার সাথে সাথে অ্যাপ এবং গেমগুলির জন্য এই উন্নতিগুলি দ্রুত গ্রহণ করা সহজ করে তুলবে।
প্ল্যাটফর্ম লুমেক্স সিএসএস উৎপাদন-প্রস্তুত ডিজাইনের সাহায্যে সমস্ত অংশ (C1 CPU, Mali G1 GPU, ইন্টারকানেক্ট এবং মেমোরি) একত্রিত করে 3 এনএম, হার্ডওয়্যার টেলিমেট্রি এবং আর্ম সিস্টেমের সামঞ্জস্য LPDDR6 সহ। এটি অংশীদারদের তাদের মোবাইল এবং ল্যাপটপ প্রকল্পগুলিকে 14 কোর পর্যন্ত স্কেলযোগ্য ক্লাস্টার এবং ডিভাইসে AI ক্ষমতা সহ ত্বরান্বিত করতে দেয়।
আর্ম C1 একত্রিত করে টেকসই কর্মক্ষমতা, দক্ষতা এবং SME2-এর জন্য CPU-গুলিতে AI-এর জন্য একটি সত্যিকারের ধাক্কা; তারা প্রতিটি পণ্য পরিসরের সাথে ক্লাস্টারগুলিকে খাপ খাইয়ে নেওয়ার জন্য C1-DSU-এর নমনীয়তা প্রদান করে এবং মোবাইল এবং পোর্টেবল SoC-এর পরবর্তী তরঙ্গের জন্য একটি শক্ত ভিত্তি তৈরি করে যা সর্বদা ক্লাউডের উপর নির্ভর না করেই শক্তি, স্বায়ত্তশাসন এবং AI ক্ষমতার ভারসাম্য বজায় রাখতে চায়।