[صفحه اصلی ]    
بخش‌های اصلی
درباره دانشکده::
مدیریت دانشکده::
اعضای هیات علمی ::
معرفی افراد::
امور آموزش و اطلاعیه دفاعیه ها::
امور فرهنگی::
امور پژوهشی::
اخبار و رویدادهای دانشکده::
فضاهای آموزشی و تحقیقاتی ::
تسهیلات پایگاه::
تماس با ما::
::
ورود به سایت دروس
دانشجویان روزانه و پردیس
دانشجویان مرکز آموزش الکترونیکی
..
اطلاعیه ها
 اطلاعیه های آموزشی
..
فراخوان ها
فراخوان های همکاری با صنعت و سازمان ها
..
دفاعیه‌ها

دفاعیه های دکتری


دفاعیه های کارشناسی ارشد

..
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
:: میثم احمدی ::
 | تاریخ ارسال: 1404/9/24 | 
دانشجو میثم احمدی دانشجوی دکتری، دکتر محمدرضا جاهد مطلق،دکتر عادل ترکمان رحمانی مورخ: 1404/09/30ساعت: 17:00 از رساله دکتری خود با عنوان " ارائه چارچوبی برای طراحی  تعامل کاربری  با هدف ارتقاء استنباط کاربر " دفاع خواهند نمود. 
 

ارائه ­دهنده:
  میثم احمدی 

استاد راهمنا

دکتر محمدرضا جاهد مطلق

دکتر عادل ترکمان رحمانی


هیات داوران:

 دکتر مزینی

 دکتر مینایی

 دکتر طالب‌پور

 دکتر ناظرفرد



 زمان 30 اذر  ماه 1404

  ساعت: 17:00
 

مکان: سالن دفاعیه طبقه سوم دانشکده مهندسی کامپیوتر
 

چکیده

ارشد شتابان سامانه‌های هوشمند مبتنی بر عامل‌ها و توانمندی‌های ناشی از آن، تعامل انسان و رایانه در حال حرکت از الگوی «ابزارمحور» به «عامل‌محور» است. با این حال، فاصله‌ای چشمگیر میان قدرت محاسباتی سامانه‌های زیرین (نظیر مدل‌های زبانی بزرگ) و لایه‌ی رویین تعامل باقی مانده است. سامانه‌های موجود، اغلب انسان را وادار می‌کنند که خود را با منطق ماشین تطبیق دهد ، که این امر به گسستگی تجربه ، افزایش بار شناختی و تنش فناوری  منجر می‌شود. نیاز اصلی پژوهش حاضر، ارائه‌ی یک چارچوب طراحی است که بتواند اصول هوشمندی انسان‌محور را به‌طور ساختارمند از سطح تحلیل نیازهای انسانی (شامل ملاحظات شناختی، عاطفی و ارزشی) تا طراحی و پیاده‌سازی معماری عامل‌ها ترجمه کند.هدف اصلی این رساله، تدوین و ارزیابی یک چارچوب طراحی تعامل انسان و عامل  بر پایه‌ی الگوی معماری «ذهنبدنعامل» است. این چارچوب با الهام از معماری‌های شناختی و مراتب نفس در فلسفه‌ی اسلامی ، عامل هوشمند را نه یک جعبه‌ی سیاه، بلکه یک شریک شناختی دارای حافظه، توجه، فراشناخت و مدل کاربر در نظر می‌گیرد. برای پرداختن به حل مسئله، چارچوب پیشنهادی معماری دو لایه‌ای را تعریف می‌کند: بدن عامل، که مسئول تمامی تعاملات حسیحرکتی با محیط و تولید پویا و خودکار رابط کاربری است ؛ و ذهن عامل، که وظیفه‌ی استدلال سطح بالا، نظارت بر عملکرد و یادگیری تدریجی علایق و ترجیحات مخاطب را بر عهده دارد. همچنین برای مدل‌کردن ابهام و وابستگی‌های زمینه‌ای در استدلال، یک مدل نوروسیمبولیک مبتنی بر منطق کوانتومی در لایه‌ی ذهن پیشنهاد شده است. دستاورد عملی این چارچوب از طریق پیاده‌سازی و ارزیابی در دو محیط حساس، سنجیده شد: خبرخوان هوشمند و دستیار شناختی در محیط آینده‌پژوهی دفاعی نتایج آزمایش‌ها شواهدی مبنی بر قابلیت‌های زیر را تأیید کرد: افزایش تفسیرپذیری رفتار عامل، کاهش بار شناختی کاربر از طریق مدیریت پویا و خودکار رابط ، و امکان تعمیم‌پذیری منطق تعاملی عامل به دامنه‌های جدیداین چارچوب در نهایت، به جایگزینی انسان، سامانه‌ها و عامل‌ها را در خدمت ارتقاء فرآیند تفکر، استنباط و خلاقیت انسانی قرار می‌دهد.

 

Abstract

A Conceptual Framework for User Interaction Design Aimed at Enhancing User Inference

The accelerating growth of intelligent systems based on agents and their associated capabilities is driving Human-Computer Interaction (HCI) to transition from a "tool-centric" paradigm to an "agent-centric" one. However, a significant gap remains between the vast computational power of underlying systems (such as large language models) and the superficial, disjointed, and exhausting nature of the user's interactive experience. Existing systems often force the human user to adapt to the machine's logic, which leads to fragmented experiences, increased cognitive load, and technological stress.
The core need of this research is to present a design framework that can structurally translate the principles of Human-Centered Intelligence from the analysis of human needs (including cognitive, emotional, and value-based considerations) to the design and implementation architecture of intelligent agents. The primary goal of this dissertation is to develop and evaluate a Human-Agent Interaction Design Framework (H-AI-D) based on the "Mind–Body" architecture. Drawing inspiration from cognitive architectures and the classical philosophical tradition, this framework models the intelligent agent not as a black box, but as a cognitive partner possessing memory, attention, metacognition, and a user model.
To address the problem, the proposed framework defines a dual-layered architecture: the Agent Body, a general, flexible, and learning layer responsible for all sensory-motor interactions with the environment and the dynamic, automated generation of the user interface; and the Agent Mind, the cognitive layer tasked with high-level reasoning, performance monitoring, and the gradual learning of the user's interests and preferences.
 Furthermore, to model the ambiguity and contextual dependencies inherent in reasoning, a Neuro-Symbolic Quantum Logic Model is proposed for the Mind layer. The practical achievement of this framework was assessed through implementation and evaluation in two sensitive domains: an Intelligent News Reader and a Cognitive Assistant in a Defense Foresight Workspace. The experimental results provided evidence for the framework's capabilities, including: enhanced interpretability of the agent's behavior, reduction of user cognitive load through dynamic and automated interface management, and the generalizability of the interactive logic to new domains. Ultimately, instead of replacing humans, this framework places agents and systems in service of enhancing human thought processes, inference, and creativity.


 
دفعات مشاهده: 141 بار   |   دفعات چاپ: 19 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
>
:: جمیله خلیلی شهروز ::
 | تاریخ ارسال: 1404/8/25 | 
دانشجو جمیله خلیلی شهروز دانشجوی دکتری، دکتر مرتضی آنالویی مورخ۱۴۰۴/۰۸/۲۸ساعت: ۱۷:۰۰ از رساله دکتری خود با عنوان " حفظ حریم خصوصی با استفاده از اثبات صفردانش در شبکه های موردی بین خودرویی " دفاع خواهند نمود. 
 

ارائه ­دهنده:

جمیله خلیلی شهروز 

استاد راهمنا


دکتر مرتضی آنالویی





هیات داوران:

دکتر احمد اکبری

 دکتر محمد عبدالهی 


دکتر بابک صادقیان ( دانشگاه امیرکبیر)


دکتر احمد خونساری ( دانشگاه تهران)



 زمان۲۸ آبان  ماه ۱۴۰۴

  ساعت: ۱۷:۰۰
 

مکان:   سالن دفاعیه طبقه سوم دانشکده مهندسی کامپیوتر
 

چکیده

شبکه های موردی بین خودرویی ( VANET ) به منظور تبادل اطلاعات حیاتی  مانند وضعیت جاده، تراکم ترافیکی و سرعت خودروها طراحی شدەاند و نقش کلیدی در افزایش ایمنی و کارایی سامانه های حمل و نقل هوشمند دارند. با این حال، ماهیت باز این شبکه ها آن ها را در معرض تهدیدهای امنیتی گوناگون و خطر نقض حریم خصوصی قرار می دهد. از این رو توسعه سازوکارهای احراز هویت و در عین حال حفظ کننده ی ناشناسی کاربران به عنوان یکی از چالش های اصلی در پیاده سازی VANET مطرح است. در این پژوهش، یک طرح احراز هویت گمنام مبتنی بر اثبات های صفر دانش SNARK ارائه شده است که ضمن فراهم کردن ناشناسی مشروط، امکان راستی آزمایی پیام های مبادله شده بین خودروها را نیز فراهم می سازد. به منظور کاهش زمان محاسباتی اثبات ها، از فناوری زنجیره بلوکی جهت ذخیره محاسبات تکراری و حذف وابستگی به مرجع مرکزی بهره گرفته شده است. افزون بر این، به منظور رفع چالش های مرتبط با ابطال گواهی ها در سیستم های مبتنی بر کلید عمومی (PKI) یک  سازوکار لغو گواهی با حفظ حریم خصوصی مبتنی بر انباشتگرهای دودویی پیشنهاد گردیده که زمان بررسی گواهی های لغو شده را کاهش می دهد. در طرح پیشنهادی، امکان به روزرسانی گروهی شاهدهای کاربران توسط خودشان نیز فراهم شده تا کارایی سامانه در محیط های پر ترافیک افزایش یابد. نتایج ارزیابی های امنیتی و شبیه سازی نشان می دهد طرح ارائه شده از نظر امنیت، کارایی و مقیاس پذیری نسبت به روش های مشابه بهبود قابل توجهی داشته و برای محیط های حساس به زمان VANET مناسب است.

Abstract

In the recent years, Vehicular Ad-hoc Networks (VANETs) have gained significant attention as an effective means of enabling communication and information exchange among vehicles, addressing critical aspects such as road conditions, traffic congestion, vehicle speed, and location. However, the open and wireless nature of VANET communication exposes them to a wide range of security threats. therefore, Secure authentication and privacy preservation have emerged as two major challenges in VANETs. To address these vulnerabilities, privacy-preserving authentication schemes play a pivotal role. The existence of security schemes susceptible to privacy and security issues or burdened by substantial computation and communication overheads, underscores the need for further research in this domain. In this article, we present an anonymous authentication scheme based on Zero-Knowledge Proof. Specifically, we adopted Simulation Extractable Zero-Knowledge SNARKs (SE zk-SNARKs) to achieve anonymity and conditional privacy. While zk-SNARK proofs are succinct and fast to verify, the time required for proof generation poses a significant obstacle in time-sensitive VANET environment. To overcome this limitation, we focus on key components of the proof statement, separating repetitive calculations, and archiving them in the Blockchain, serving as immutable data storage. This streamlined approach renders our proposed scheme lightweight enough for efficient execution. Many existing schemes rely on Public Key Infrastructure (PKI) to mitigate security risks, ensuring authentication and message integrity through public key certificates. However, a notable drawback of these schemes arises from the utilization of the Certificate Revocation List (CRL), introducing significant delays. Given the time-sensitive nature of vehicular networks, prolonged delays may lead to severe consequences. Moreover, the process of CRL checking can inadvertently leak sensitive information about vehicles, rendering PKI-based schemes impractical for VANETs. To overcome these challenges, we propose a privacy-preserving revocation mechanism based on a zero-knowledge accumulator, tailored specifically for VANETs. This mechanism markedly reduces the time required for checking revoked certificates, while preserving user privacy. Furthermore, by leveraging Blockchain technology to publish revoked certificates in a distributed manner, we have the opportunity to reduce the time needed for distributing the revoked certificate, diminish network congestion, enhance overall efficiency, and eliminate the reliance on a single central authority. Additionally, we address the issue of non-membership witnesses updating in batch mode. Finally, thorough security checks and simulation in the appropriate environment validate the feasibility, efficiency, and fulfillment of security requirements by our proposed plan.

 

دفعات مشاهده: 994 بار   |   دفعات چاپ: 203 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
>
:: علی مختاری ::
 | تاریخ ارسال: 1404/7/23 | 
دانشجو علی مختاری دانشجوی دکتری، دکتر پیمان کبیریمورخ۱۴۰۴/۰۷/۲۳ساعت: ۱۵:۰۰ از رساله دکتری خود با عنوان "  طراحی و پیاده‌سازی واحد محاسبه با استفاده از منطق چند ارزشی " دفاع خواهند نمود. 
 

ارائه ­دهنده:

علی مختاری
استاد راهمنا

دکتر پیمان کبیری




  هیات داوران:

 دکتر محمد پویان
 دکتر شاهین حسابی
 دکتر ناصر مزینی
دکتر امیر مهدی حسینی منزه


 زمان ۲۳ مهرماه ماه ۱۴۰۴

  ساعت: ۱۵:۰۰
 

مکان:   سالن دفاعیه طبقه سوم دانشکده مهندسی کامپیوتر
 

چکیده

درسال‌های اخیر، مدارهای طراحی شده برپایه فناوری سیلیکون به مرزهای نهایی سرعت خود نزدیک شده‌اند هم‌زمان، نیاز به افزایش توان پردازشی و سرعت سامانه‌های رایانه‌ای بیش از پیش احساس می‌شود. از این رو، پژوهشگران رویکردهای متعددی را برای ارتقای سرعت سیستم‌های محاسباتی بررسی کرده‌اند؛ از جمله تغییر در فناوری ساخت، بهره‌گیری از معماری‌های چند‌هسته‌ای و نیز استفاده از روش‌های نوآورانه همچون منطق چند‌ارزشی. منطق چند ارزشی یکی از چالش برانگیزترین روش‌های پیاده­سازی مدارهای الکترونیکی است که ظرفیت دگرگون‌سازی طراحی مدارهای سیلیکونی را دارد. در این پژوهش تلاش شده است تا عناصر مورد نیاز واحد محاسبه و منطق با استفاده از قطعات تجاری و در قالب مدارهای با تراکم بالا، بر پایه رویکرد منطق چند‌ارزشی و محاسبه با مدارهای آنالوگ طراحی شود. در این طراحی، رویکرد اصلی مبتنی بر مدارهای مد ولتاژ است. مدارهای ارائه شده برپایه فناوری سیلیکون و ترانزیستورهای اثر میدان طراحی شده‌اند که دهه‌هاست در ساخت مدارهای پرتراکم بکارگرفته می‌شوند. هرچند ابعاد این فناوری بزرگ‌تر از مرزهای نوین فناوری‌های نانویی است، اما به دلیل قابلیت ساخت و پیاده‌سازی عملی، می­تواند از بسیاری از فناوری‌های نوظهور در حوزه مدارهای چند‌ارزشی (مانند ترانزیستورهای نانولوله‌ کربنی، اتوماتاهای سلولی مبتنی بر نقاط کوانتومی و ترانزیستورهای تک‌الکترونی) برتر باشد. طراحی مدارهای چند‌ارزشی با استفاده از عناصر تجاری با چالش‌های متعددی همراه است؛ از جمله مدیریت نویز، ایجاد سطوح ولتاژی متفاوت و نحوه‌ی پیاده‌سازی عملی مدارها.  نخست یک منطق کامل ریاضی ۱۰ ارزشی ارائه شده است. سپس تلاش شده تا مدارهای منطقی متناسب با این منطق ریاضی ارائه شوند و در پایان مدارهای بخش حافظه و محاسبات ارائه شده‌اند. برای کاهش تعداد ترانزیستورها، رویکرد استفاده از روش‌های آنالوگ در طراحی مدارهای چند‌ارزشی مورد توجه قرار گرفته است. با این حال، بهره‌گیری از مدارهای آنالوگ حساسیت سیستم را در برابر نویز و لغزش عملکرد افزایش می‌دهد. به منظور کاهش این اثرات، مداری با عنوان «بافر تصحیح‌کننده» به مجموعه مدارهای طراحی‌شده افزوده شده است. در طراحی این خانواده از مدارها، تلاش شده است تا همه اجزا از نظر الکترونیکی با یکدیگر سازگار باشند. به بیان دیگر، امکان اتصال و سیم‌کشی مستقیم میان مدارها بدون ایجاد اختلال در عملکرد فراهم شده است. همچنین، تلاش شده است تا حد امکان تغذیه‌ی یکسان برای کل مدارها در نظر گرفته شود. نتایج حاصل نشان می‌دهد که بخش عمده‌ای از اهداف پژوهش به شکلی مطلوب تحقق یافته است. از جمله این دستاوردها می‌توان به طراحی خانواده‌ای از منطق ده‌ارزشی بر پایه‌ی مدارهای آنالوگ و با استفاده از عناصر تجاری اشاره کرد.



 

Abstract

In recent years, silicon-based circuit technologies have approached their fundamental speed limitations, while the demand for higher-performance computer systems continues to increase. To overcome these constraints, researchers have explored various approaches to enhance computational speed, including advancements in fabrication technologies, the adoption of multi-core architectures, and the introduction of innovative paradigms such as multi-valued logic (MVL). Among these, MVL represents one of the most challenging yet promising methods for extending the capabilities of conventional silicon circuits. This research aims to design the essential components of an arithmetic and logic unit (ALU) using commercially available, high-density silicon elements based on the MVL approach. The proposed circuits employ field-effect transistors (FETs), which have been utilized for decades in high-density silicon technologies. Although the implemented technology node is not at the cutting edge, it demonstrates significant advantages over alternative MVL implementation platforms—such as carbon nanotube transistors, quantum-dot cellular automata, and single-electron transistors—which face severe manufacturability limitations. The proposed designs operate in voltage mode and address several key challenges inherent to MVL circuit design using commercial devices, including noise susceptibility, voltage-level generation, and practical implementation. A complete decenary (۱۰-valued) logic system is first formulated, followed by the design of logic circuits implementing this system. Subsequently, the memory and arithmetic units are developed. To minimize transistor count, the circuits are realized using analog design techniques. However, this analog implementation introduces sensitivity to noise and signal degradation; therefore, a corrective buffer circuit is incorporated to mitigate these effects. Furthermore, all circuit components have been designed to ensure full electrical compatibility within the proposed logic family—allowing direct interconnection without operational conflicts—and to share a unified power supply across most modules. Experimental and simulation results confirm that the principal objectives of this work have been successfully achieved, demonstrating the feasibility of implementing a decenary logic family using analog design techniques and standard commercial elements.

Keywords: Multilevel Logic, Logic Unit, Computing Unit, Memory, Voltage Mode, Noise, Implementation


 

دفعات مشاهده: 1970 بار   |   دفعات چاپ: 322 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
>
:: زمن فاضل جبر ::
 | تاریخ ارسال: 1404/6/29 | 
دانشجو زمن جبر دانشجوی دکتری، دکتر ناصر مزینی مورخ۱۴۰۴/۰۶/۳۰ساعت: ۱۴ الی ۱۷ از رساله دکتری خود با عنوان "  Arabic Speech Recognition from Visual Cue Using Deep Learning " دفاع خواهند نمود. 
 

ارائه ­دهنده:

زمن فاضل جبر

  استاد راهنما:


دکتر ناصر مزینی
استاد مشاور: دکتر اعتمادی



  هیات داوران:

دکترمینائی
 دکترمحمدی
 دکترصامتی

  دکتر زنیالی


 زمان ۳۰ شهریورماه ماه ۱۴۰۴

  ساعت:۱۴ الی ۱۷
 

مکان:  اتاق دفاع طبقه دوم

 

Abstract


Visual speech recognition (VSR), or lip-reading, is crucial in human communication and speech understanding. Lip-reading is a challenging task that requires deep learning models to achieve high accuracy. The researchers introduced many deep learning models using Deep Neural Networks (DNNs) with letters, digits, words, and sentences for other languages, but not Arabic. The main reason for the low number of lip-reading studies in Arabic is the unavailability of a large-scale dataset that can be used to train a DNN.
The work in this thesis contributes to automatic Arabic lip-reading at the word and sentence levels using DNN with visual cues only. We attempted to find a solution to the problem of lacking a large-scale Arabic dataset for training a DNN model.  To this end, we propose an end-to-end Arabic lip-reading model that can be trained on a limited dataset, which combines a Visual module consisting of a multi-layer Convolutional Neural Network (CNN) and a Temporal module comprised of Gated Recurrent Unit (GRU) and soft-max layers, taking into account the balance between the size of the dataset and the number of model parameters. To train this model, we created a limited Arabic dataset comprising ۲۰ words spoken by ۴۰ native Arabic speakers. At the word level, our proposed method is evaluated on ۱) our dataset, where we obtained an accuracy equal to ۸۳.۰۲%; ۲) the Dweik et al. dataset, where we obtained an improvement rate of ≈ ۳% on the result recorded by their work. In addition, we employed the Visual module for person identification using the viseme image and obtained a high-performance result.
 At the sentence level, we modified the same end-to-end model to address the problem from two perspectives: first, as a classification problem, and second, as a sequence prediction problem. The modification is only applied to the Temporal module, while the Visual model remains unchanged. In the classification problem, the Temporal module consists of a stack of GRUs and a fully connected layer. In the sequence prediction problem, the Temporal module is the encoder-decoder network; the encoder consists of three GRU layers, while the decoder consists of two GRU layers with an attention mechanism. To train the end-to-end model, we collected a sentence-level dataset for the Arabic language, comprising ۵۵ sentences with ۱۳۹ unique words uttered by ۴۰ individuals, including ۲۸ declarative sentences, ۲۰ interrogative sentences, and ۷ request sentences. This dataset is the largest sentence-level Arabic language dataset addressing lip-reading problems. We made this dataset involve all ۲۸ phonemes in Arabic; this attribute is only in our dataset and is missing in all previous works for the Arabic language.
For the sentence classification problem, the end-to-end model was first applied to our dataset, yielding recognition accuracies of ۹۰.۴۵% for person-dependent and ۷۱.۵۳% for person-independent experiments. Then, it was used in the BlidAVS۱۰ dataset, and an accuracy of ۸۳.۰۹ was obtained for the person-independent experiment. For the sequence prediction problem, the end-to-end model was applied to our dataset, yielding an ۸۰.۵۱% Word Error Rate (WER).

 

دفعات مشاهده: 1926 بار   |   دفعات چاپ: 330 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
>
:: زمن فاضل جبر ::
 | تاریخ ارسال: 1404/6/29 | 
دانشجو زمن جبر دانشجوی دکتری، دکتر ناصر مزینی مورخ۱۴۰۴/۰۶/۲۹ساعت: ۱۴ الی ۱۷ از رساله دکتری خود با عنوان "  Arabic Speech Recognition from Visual Cue Using Deep Learning " دفاع خواهند نمود. 
 

ارائه ­دهنده:

زمن فاضل جبر

  استاد راهنما:


دکتر ناصر مزینی
استاد مشاور: دکتر اعتمادی



  هیات داوران:

دکترمینائی
 دکترمحمدی
 دکترصامتی

  دکتر زنیالی

 زمان ۲۹ شهریورماه ماه ۱۴۰۴

  ساعت:۱۴ الی ۱۷
 

مکان:  اتاق دفاع طبقه دوم

 

Abstract


Visual speech recognition (VSR), or lip-reading, is crucial in human communication and speech understanding. Lip-reading is a challenging task that requires deep learning models to achieve high accuracy. The researchers introduced many deep learning models using Deep Neural Networks (DNNs) with letters, digits, words, and sentences for other languages, but not Arabic. The main reason for the low number of lip-reading studies in Arabic is the unavailability of a large-scale dataset that can be used to train a DNN.
The work in this thesis contributes to automatic Arabic lip-reading at the word and sentence levels using DNN with visual cues only. We attempted to find a solution to the problem of lacking a large-scale Arabic dataset for training a DNN model.  To this end, we propose an end-to-end Arabic lip-reading model that can be trained on a limited dataset, which combines a Visual module consisting of a multi-layer Convolutional Neural Network (CNN) and a Temporal module comprised of Gated Recurrent Unit (GRU) and soft-max layers, taking into account the balance between the size of the dataset and the number of model parameters. To train this model, we created a limited Arabic dataset comprising ۲۰ words spoken by ۴۰ native Arabic speakers. At the word level, our proposed method is evaluated on ۱) our dataset, where we obtained an accuracy equal to ۸۳.۰۲%; ۲) the Dweik et al. dataset, where we obtained an improvement rate of ≈ ۳% on the result recorded by their work. In addition, we employed the Visual module for person identification using the viseme image and obtained a high-performance result.
 At the sentence level, we modified the same end-to-end model to address the problem from two perspectives: first, as a classification problem, and second, as a sequence prediction problem. The modification is only applied to the Temporal module, while the Visual model remains unchanged. In the classification problem, the Temporal module consists of a stack of GRUs and a fully connected layer. In the sequence prediction problem, the Temporal module is the encoder-decoder network; the encoder consists of three GRU layers, while the decoder consists of two GRU layers with an attention mechanism. To train the end-to-end model, we collected a sentence-level dataset for the Arabic language, comprising ۵۵ sentences with ۱۳۹ unique words uttered by ۴۰ individuals, including ۲۸ declarative sentences, ۲۰ interrogative sentences, and ۷ request sentences. This dataset is the largest sentence-level Arabic language dataset addressing lip-reading problems. We made this dataset involve all ۲۸ phonemes in Arabic; this attribute is only in our dataset and is missing in all previous works for the Arabic language.
For the sentence classification problem, the end-to-end model was first applied to our dataset, yielding recognition accuracies of ۹۰.۴۵% for person-dependent and ۷۱.۵۳% for person-independent experiments. Then, it was used in the BlidAVS۱۰ dataset, and an accuracy of ۸۳.۰۹ was obtained for the person-independent experiment. For the sequence prediction problem, the end-to-end model was applied to our dataset, yielding an ۸۰.۵۱% Word Error Rate (WER).

 

دفعات مشاهده: 1862 بار   |   دفعات چاپ: 347 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
>
:: مرجان کرامتی ::
 | تاریخ ارسال: 1404/3/25 | 
دانشجو مرجان کرامتی دانشجوی دکتری، دکتر ناصر مزینی مورخ۱۴۰۴/۰۴/۰۲ساعت:  ۱۶:۰۰ از رساله دکتری خود با عنوان " جانمایی کنترلگرها در شبکه هوشمند برق نرم افزار محور با استفاده از سیستم های چندعاملی" دفاع خواهند نمود. 
دفعات مشاهده: 3279 بار   |   دفعات چاپ: 545 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
>
:: حدیث بشیری ::
 | تاریخ ارسال: 1404/2/16 | 
دانشجو حدیث بشیری دانشجوی دکتری، دکتر حسن نادری مورخ :   تاریخ ۱۴۰۴/۰۲/۲۴  ساعت:  ۱۲:۳۰ از رساله دکتری خود با عنوان " تشخیص محبوبیت رویداد بر اساس تحلیل داده‌های شبکه‌های اجتماعی برخط" دفاع خواهند نمود. 

دفعات مشاهده: 5903 بار   |   دفعات چاپ: 977 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
>
::  اکرم کلائی ::
 | تاریخ ارسال: 1403/12/14 | 
دانشجو اکرم کلائی دانشجوی دکتری، دکتر سعید پارسا  مورخ :   تاریخ  ۱۸/۱۲/  ۱۴۰۳ ساعت:  ۱۱:۰۰ صبح از رساله دکتری خود با عنوان "تحلیل دامنه و تأثیر آن بر بهبود آزمون‌پذیری و شرح‌پذیری سیستم‌های سایبر- فیزیکی مبتنی بر یادگیری ماشین " دفاع خواهند نمود. 
دفعات مشاهده: 3226 بار   |   دفعات چاپ: 471 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
>
:: سایر مطالب این بخش: ::
::  آرمان سان احمدی - 1403/8/1 -
:: محمد حاجی زاده صفار - 1403/8/1 -
:: سیدمهدی شریعت زاده - 1403/6/24 -
:: راضیه زال - 1403/6/18 -
:: عبدالله علی السلامی - 1403/6/18 -
:: رحمن عمیری - 1403/2/24 -
:: مرضیه پندی - 1403/2/2 -
:: مریم سرخی - 1402/12/21 -
:: یعرب عبدالله - 1402/11/29 -
:: زهرا رشیدی - 1402/8/17 -
:: حجت‌اله اسماعیلی - 1402/6/27 -
:: مرتضی ذاکری نصرآبادی - 1402/6/22 -
:: پریا دربانی - 1402/6/18 -
:: سمیه کاشی - 1402/4/20 -
:: زهرا جلالیان - 1401/8/22 -
:: بشری پیشگو - 1401/8/21 -
:: علی اصغر داودآبادی - 1401/7/17 -
:: محبوبه ریاحی مدوار - 1400/12/4 -
:: راضیه روستائی - 1400/11/3 -
:: مهران شتابی - 1400/10/26 -
:: عاطفه پاکزاد - 1400/9/17 -
:: مجید عسگری بیدهندی - 1400/9/3 -
:: محمد شیری - 1400/7/26 -
:: کاوه کدخدا - 1400/7/26 -
:: کاوه کدخدا - 1400/7/26 -
:: احسان علیرضایی - 1400/6/30 -
:: مریم آموزگار - 1400/4/30 -
:: محمدامین مهرعلیان - 1400/1/30 -
:: احمد ملکیان بروجنی - 1399/12/13 -
:: علی متقی - 1399/12/5 -
:: محمد مهدی طالبی - 1399/11/12 -
:: محمد شاهوردی - 1399/11/7 -
:: محمد طاهری فرد- ۱۳۹۹/۰۹/۱۹ - 1399/9/17 -
:: میثم آهنگران- ۱۳۹۹/۰۹/۰۵ - 1399/9/3 -
:: جلسه دفاعیه از رساله دکتری - 1399/7/8 -
:: جلسه دفاعیه از رساله دکتری - 1399/7/5 -
:: جلسه دفاعیه از رساله دکتری - 1399/6/31 -
:: جلسه دفاعیه از رساله دکتری - 1399/3/21 -
:: جلسه دفاعیه از رساله دکتری - 1399/3/11 -
:: جلسه دفاعیه از رساله دکتری - 1399/2/10 -
:: جلسه دفاعیه از رساله دکتری - 1398/11/14 -
:: جلسه دفاعیه از رساله دکتری - 1398/11/7 -
:: جلسه دفاعیه از رساله دکتری - 1398/6/24 -
:: جلسه دفاعیه از رساله دکتری - 1398/2/17 -
:: جلسه دفاعیه از رساله دکتری - 1398/2/4 -
:: جلسه دفاعیه از رساله دکتری - 1397/9/18 -
:: جلسه دفاعیه از رساله دکتری - 1397/8/27 -
:: جلسه دفاعیه از رساله دکتری - 1397/8/23 -
:: جلسه دفاعیه از رساله دکتری - 1397/6/11 -
data
Persian site map - English site map - Created in 0.21 seconds with 90 queries by YEKTAWEB 4722