metadata
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:31837
- loss:CosineSimilarityLoss
base_model: intfloat/multilingual-e5-large
widget:
- source_sentence: >-
query: شتاب سنجها در کدام زمینههای علمی و صنعتی کاربرد دارند و چگونه
میتوانند به پیشرفتهای علمی کمک کنند؟
sentences:
- "passage: چکیده\r\nسرریزها در کارهای عملی مهندسی عمران مورد استفادهی فراوان دارند، بنابراین بررسی و مطالعهی آنها از اهمیت خاصی برخوردار است. در برخی از موارد بهدلیل محدودیتهای اجرایی، طراحی سرریزهای باانحنا در پلان اجتنابناپذیر است. در چنین شرایطی مطالعه توزیع جریان در طول سرریز و دیگر پارامترهای مربوط به آن، حائز اهمیت خواهد بود. در این پژوهش یک مدل فیزیکی از سرریز سدگرمیچای میانه که از نوع اوجی آزاد با قوس محوری در پلان (مدل اصلی) است، در مقیاس 1:75 مورد آزمایش قرار گرفت. همچنین بهمنظور بررسی اثر انحنای سرریز بر عملکرد هیدرولیکی آن یک مدل دیگر از سرریز با محور مستقیم و شرایط هندسی مشابه (مدل صاف) مورد مقایسه قرار گرفت. اندازهگیریها در سراسر بدنه سرریز و برای 14 دبی (14 مقدار از نسبت عمق آب روی سرریز به عمق طراحی (h/Hd) در مدل اصلی و 11 دبی (11 مقدار از نسبت عمق آب روی سرریز به عمق طراحی (h/Hd) در مدل صاف انجام شد. نتایج مربوط به فشار استاتیک در مدل اصلی نشان داد حداقل فشار برای همه دبیهای مورد آزمایش تا قبل از استغراق سرریز، در محل اتصال پروفیل اوجی به تنداب سرریز و برای"
- >-
passage: در این پایان نامه یک شتاب سنج خازنی سه محوره با استفاده از
تکنولوژی میکروماشین و تنها با یک جرم متحرک طراحی و شبیه سازی شده است.
این شتاب سنج با استفاده از تکنولوژی میکروماشین کاری سطحی طراحی شده است.
شتاب سنج پیشنهادی از پنج گروه خازنی تشکیل یافته است، دو گروه که در ربع
اول و سوم مثلثاتی قرار دارند شتاب در جهت X را اندازه گیری می کنند و دو
گروه دیگر که در ربع دوم و چهارم مثلثاتی قرار دارند برای اندازه گیری شتاب
در جهت Y استفاده شده است. همچنین از گروه خازنی پنجم برای اندازه گیری
شتاب در جهت Z استفاده می کنیم. که این تقسیم بندی باعث می شود شتاب
اعمالی در یک جهت بر جهت دیگر تأثیر نگذارد. این طراحی به گونه ای می باشد
که در جهات X و Y از حالت دیفرانیسلی برای الکترودها و در جهت Z از حالت
غیر دیفرانسیلی استفاده کرده ایم. برای اندازه گیری شتاب در جهات X
وYو Z از الکترودهای خازنی با تغییر فاصله هوایی استفاده شده است. این
شتاب سنج قابلیت تشخیص و اندازه گیری هم زمان شتاب اعمالی به سه محور را
دارد و توسط یک مدار پردازشگر ساده نتایج خروجی شتاب سنج قابل تفکیک هستند.
رنج اندازه گیری ش
- "passage: با پیشرفت سریع فناوری محاسبات و صنعت رایانه ع?قه محققان به طراحی و توسعه دستگاههای تشخیص خودکار برای بهبود خدمات پزشکی افزایش یافته است. دو ویژگی اصلی اینگونه دستگاهها قابلیت اطمینان با? و دقت زیاد آنهاست..\r\nبدلیل مشکلات متعدد در تصاویر شبکیهی چشم استخراج عروق از این تصاویر دشوار می باشد. محققان این نقاط ضعف را مورد بررسی قرار داده با الگوریتم های پیشنهادی تلاش در بهبود روش های استخراج عروق نموده اند.\r\nآنچه در این تحقیق مورد توجه قرار گرفته است، جداسازی رگ های شبکیه ی چشم از تصاویر مربوط به آن است. اگر به این تصاویر به صورت یک رویه در فضای 3 بعدی نگاه کنیم به طوری که بعد سوم میزان روشنایی تصویر را نشان می دهد ، متوجه می شویم که رگ ها به شکل رویه های ناودانی با مقطع گوسی با ارتفاع و عرض های متفاوت هستند. با استفاده از این مدل الگوریتمی برای استخراج عروق پیشنهاد نموده ایم.\r\nالگوریتم پیشنهاد شده در این تحقیق شامل 3 بخش اساسی است. بخش اول مربوط به حذف نویزو عدم یکنواختی روشنایی در تصاویر شبکیه است که مرحله ی پیش پردازش نام دارد. این مرحله خود شامل سه بخش است که در بخش اول تبدیل کانتو"
- source_sentence: >-
query: خصوصیات اصلی موتورهای سنکرون مغناطیس دائم (PMSM) چیست و چگونه بر
عملکرد آنها تأثیر میگذارد؟
sentences:
- "passage: به دلیل خصوصیات ذاتی موتورهای سنکرون مغناطیس دائم (PMSM ) نظیر: چگالی توان بالا ، لختی کم ، نسبت بالای گشتاور تولیدی به اینرسی ، شتاب گیری سریع ، سادگی عملیات نگهداری ، ضریب توان و بازده مناسب تر درسالهای اخیر در بسیاری ازکاربردهای صنعتی با سرعت متغیر در گستره توان کم و متوسط نسبت به موتورهای DC و موتورهای القایی ترجیح داده شده اند.\r\n لذا درتجهیزات بکار رفته درآزمایشگاهها ، سانتیریفیوژها ، صنایع پتروشیمی و آسانسورهای بدون موتور خانه از موتورهای سنکرون مغناطیس دائم استفاده می شود.\r\nقابلیت کنترل وتغییر سریع سرعت موتورهای آهنربای دائم سنکرون به صورت خود کنترل شونده و امکان دستیابی به عملکرد با سرعت متغیر در محدودۀ وسیع، باعث شده تا روشهای کنترل مختلفی بسته به کاربرد موتور و به منظور استفاده مطلوب از مزایای ذاتی آنها ارائه شوند.\r\n در این پایان نامه چندین نوع از روشهای کنترل سرعت متداول موتور سنکرون مغناطیس دائم بطور خلاصه ذکر گردیده و سه روش رایج تر و پر کاربردی تر از آنها از جمله روش کنترل معمول در صنعت برمبنای مولفه های جریان ،که روش حداکثر گشتاور به ازای جریان و ولتاژمی باشد،"
- >-
passage: در تصفیه پسابهای صنعتی، گاهی استفاده از دو یا چندین روش لازم
میشود. انعقاد الکتریکی بهوسیله تجزیه الکتریکی آند فلزی، توانایی تولید
لختههای هیدروکسیدهای فلزی در جریان پساب را دارد و راکتور زیستی غشایی
توانایی تولید جریان خروجی با کیفیت بالا را دارد. بنابراین ترکیب این دو
روش در مقایسه با روشهای تصفیه تکی میتواند ما را به یک بازدهی حذف
آلودگی بالاتر راهبری کند. در این پژوهش ابتدا کارکرد موثر روش انعقاد
الکتریکی در تصفیه پساب کارخانه خمیرمایه با استفاده از الکترود آلومینیوم
(Al) مورد بررسی قرار گرفت. برای انجام آزمایشها از طراحی آزمایشها
بهروش رویه پاسخ مرکزی استفاده شد و تاثیر عاملهای pH، چگالی جریان و
زمان فرآیند روی بازدهی حذف COD و کدورت مورد بررسی قرار گرفت. در این
پژوهش در فرآیند انعقاد الکتریکی، COD و کدورت پساب خام ورودی از حدود 9500
میلیگرم بر لیتر و NTU 2700 بهترتیب به حدود 4000 میلیگرم بر لیتر و NTU
273 کاهش یافت و بیشترین بازده حذف COD و کدورت برای این فرآیند بهترتیب
58 % و 90 % بهدست آمد. بهعنوان نتیجه بهینهسازی، بیشترین بازدهی حذف
COD و کدورت در شرایط بهینه
- >-
passage: مبحث تخمین حالت یا فیلترینگ، یکی از حوزههای پر کاربرد و مطرح
در زمینههای ریاضی کاربردی، آمار، و مهندسی است که سابقه تحقیق و پژوهش در
این باره، به بیش از چهل سال پیش میرسد. در کنار رویکردهای کلاسیک،
فیلترینگ تکاملی، نامی است که تا کنون به طور غیر رسمی، به مجموعهای از
روشهای فیلترینگ داده شده است که در آنها، از روشهای محاسبات تکاملی در
ترکیب با روشهای فیلترینگ کلاسیک (غالبا فیلتر ذرهای)، برای حل مسأله
فیلترینگ غیر خطی و تخمین حالت سیستمهای دینامیکی غیر خطی استفاده شده
است. در مسیر کار پژوهشی این رساله، به عنوان اولین و اساسیترین هدف، سعی
شده است که، حوزه فیلترینگ تکاملی و روشهایی که در این حوزه طبقهبندی
میشوند، به طور دقیق و کامل تعریف یا بازتعریف شوند. به عنوان هدف دوم،
مدلی کامل و کلی از فیلترهای تکاملی (مبتنی بر الگوریتم تکاملی عادی و
الگوریتمهای تخمین توزیع) ارائه شده است که خصوصیات کلی یک فیلتر تکاملی
را در بر دارد و پایهای برای فیلترهای تکاملی جدید میباشد. هدف سوم نیز،
معرفی یک یا چند روش فیلترینگ تکاملی جدید بوده است، که در نهایت منجر به
معرفی چهار روش فیلترینگ تک
- source_sentence: >-
query: در علم مواد، چه راهکارهایی برای بهبود خواص مکانیکی در مواد
کامپوزیتی وجود دارد؟
sentences:
- >-
passage: نسترن کوهی (Rosa canina L.) گیاه دارویی- زینتی متعلق به تیره
رزاسه (Rosaceae)، یکی از منابع مهم ویتامین ث در میان گیاهان محسوب
میشود. مواد موثره این گیاه سبب کاهش اسید اوریک و معالجه ناراحتیهای
ناشی از نقرس میگردد. رشد و عملکرد گیاهان در اکوسیستمها، تحت تأثیر
عوامل مختلفی نظیر نوع گونه، اقلیم منطقه و موقعیت جغرافیایی قرار دارد.
فاکتورهای اقلیمی بهویژه عرض جغرافیایی، ارتفاع محل، درجه حرارت، شدت نور،
بارندگی و خصوصیات خاک، تاثیر عمده ای بر کمیت و کیفیت مواد موثره گیاهان
میگذارد. به منظور مطالعه تاثیر اقلیم بر صفات مورفوفیزیولوژیکی، کمیت و
کیفیت مواد موثره نسترن کوهی در 4 منطقه از استان زنجان شامل ابهر، طارم،
ماهنشان و زنجان که بیشترین پراکنش این گیاه را داشتند، انتخاب گردید. طی
سالهای 1391-1390، مراحل فنولوژیکی گیاهان ثبت شده و میوهها و برگها
برداشت شدند. در این تحقیق برخی از خصوصیات مورفولوژیکی، بیوشیمیایی و
دارویی این گیاه مورد اندازه گیری و مقایسه قرار گرفت. صفات طول و قطر، وزن
تر ، درصد ماده خشک، سطح برگ، عصاره اتری، کلروفیل، پروتئین، فیبر، ویتامین
ث، راندمان استخراج عصاره،
- >-
passage: در شبکههای کنترل اعم از سیمییا بدون سیم مشکلات مهمی از جمله
داده از دست رفته و تأخیر ارتباطی وجود دارند که باید برای غلبه بر آنها
چاره اندیشید.به دلیل همین مشکلات شبکههای کنترلی است که کنترل تحت شبکه
بیشتر از انواع کنترل دیگر (غیر تحت شبکه) در معرض عیب ها و از کار
افتادنها قرار دارند.به همین منظور و در زمینه بررسیعیب در سیستم های
کنترل تحت شبکه نیز کارهای زیادی انجام شده اما اغلب آنها به جنبههایعیبی
از جمله داده از دست رفته و تأخیر در شبکه پرداخته اند.علاوه بر داده از
دست رفته و تأخیر در سیستم های کنترل تحت شبکه، دو عامل"تزریق داده" و
"استراق سمع" نیز از عوامل بروز عیب هستند. تزریق داده تصنعییا ساختگیآن
است که نفوذگر اطلاعات از پیش تعیین شده ای را به منظور نیل به اهداف
خرابکارانه جهت از کار انداختن سیستم کنترل یا ایجاد اختلال در آن وارد
شبکه میکند. استراق سمع نیز به نوعی دزدی بسته های اطلاعاتی است به طوری که
نفوذگر از این طریق اطلاعات رد و بدل شده روی شبکه را میبیند.مشکل استراق
سمع روی شبکه بالا رفتن نرخ داده از دست رفته و اعمال تاخیری علاوه بر
تاخیر ذاتی شبکه است. در این تحقیق
- >-
passage: سرانه منابع آبی جهان رو به کاهش است، بنابراین ایجاد شیوههای
نوین آبیاری از جمله آبیاری ناقص ریشه لازم است. محدودیت منابع آب و ضرورت
افزایش کارایی مصرف آب آبیاری، باعث شد ارقامی از گیاهان که به خشکی
متحملترند، کشت شوند. آگاهی از تأثیر تنش آبی بر خصوصیات فیزیولوژیکی گیاه
شامل هورمون آبسسیک اسید و نیز اثر آن بر الگوی توسعه ریشه ضروری است زیرا
تأمین مواد غذایی لازم برای رشد گیاه از ناحیه ریشه میباشد. همچنین
تنشهای محیطی اغلب سبب تغییر آبسسیک اسید بافت گیاه میشوند، بنابراین از
این ویژگی میتوان به عنوان یک نشانگر فیزیولوژی مناسب برای بررسی تحمل و
مقاومت به تنشهای محیطی استفاده نمود. از عوامل تأثیرگذار بر الگوی توسعه
ریشه و خصوصیات فیزیولوژیکی، مقدار و مدیریت مصرف آب است. بنابراین پژوهش
حاضر در قالب طرح بلوکهای کامل تصادفی با پنج تیمار و سه تکرار در سال
1391 در مزرعه پژوهشی دانشگاه علوم کشاورزی و منابع طبیعی ساری انجام شد.
تیمارهای آبیاری شامل آبیاری کامل، آبیاری ناقص ریشه در دو سطح 75% و 55%
وکمآبیاری سنتی (تنظیم شده) در دو سطح 75% و 55% بود. به منظور بررسی صفات
ریشه شامل طول، سطح
- source_sentence: >-
query: این تحقیق چه نتایجی در مورد کارایی پرههای توربین باد به دست آورده
است؟
sentences:
- >-
passage: ارزیابی و گزینش بسته های نرم افزاری پروسه ی تصمیم گیری و وقت
گیری است. انتخاب بسته ی نرم افزاری نامناسب می تواند پرهزینه باشد و در
مقابل پروسه های تجاری و عملکرد سازمان را تحت تاثیر قرار می دهد. در این
پروژه ما به توصیف موارد زیر می پردازیم: (1) روشهای کلی و جامع انتخاب نرم
افزار، (2) معیار ارزیابی نرم افزار و (3) رویکرد سیستمی بر مبنای اطلاعات
ترکیبی به منظور یاری رساندن به تصمیم گیرندگان در ارزیابی و انتخاب بسته
های نرم افزاری. رویکرد سیستمی بر مبنای اطلاعات ترکیبی (HKBS) از
تکنیک های جامع و بهم پیوسته ی استدلال قانونی و استدلال موردی استفاده می
کند. استدلال قانونی را برای فراهم آوردن نیازهای بسته نرم افزاری و فرمول
سازی یک نمونه مسئله (مشکل) بکار می برند. CBR برای بازیابی و مقایسه ی
بسته های نرم افزاری مورد بررسی با نیازهای کاربران بسته بکار می روند.
همچنین این پروژه رویکرد HKBS را با تکنیک های ارزیابی نرم افزاری موجود
مثل فرآیند سلسله مراتبی (AHP ) و روش نمره دهی وزنی (WSM) مقایسه می کند.
- >-
passage: هدف از مطالعه ی انجام شده استخراج عصاره ی اسپیرولینا پلاتنسیس
با کمک امواج مایکروویو و ارزیابی خاصیت آنتی اکسیدانی و ضد باکتریایی آن و
همچنین کاربرد حالت بهینه عصاره ی بدست آمده جهت بهبود مدت زمان ماندگاری
روغن ماهی کیلکا می باشد. فرایند استخراج تحت تاثیر چهار پارامتر توان
مایکروویو، مدت زمان استخراج، مقدار نمونه و حجم حلال قرار گرفت که بوسیله
نرم افزار Design expert و روش سطح پاسخ بهینه سازی گردید. شش شاخص آنتی
اکسیدانی مختلف شامل:DPPH، مقدار فنول کل، مقدار فلاوونوئید کل، توانایی
جذب فلز و توانایی احیای یون های آهن و مس جهت ارزیابی فعالیت آنتی
اکسیدانی عصاره اسپیرولینا پلاتنسیس استفاده شد.در ادامه شرایط بهینه
بصورت توان 200 وات، مدت زمان 9 دقیقه، مقدار نمونه 14 گرم و حجم حلال 200
میلی لیتر تعیین شد. فعالیت آنتی اکسیدانی عصاره بهینه حاصل از مایکروویو
با فعالیت آنتی اکسیدانی عصاره حاصل از روش سنتی الکترومنتل مورد مقایسه
قرار گرفت که نتایج نشان داد مایکروویو اثر تخریبی آنچنانی بر میزان فعالیت
آنتی اکسیدانی نداشته است و بنا براین می تواند به عنوان یک روش استخراج
سریع و اقتصادی مورد استفا
- "passage: قدرت و انرژی باد بهترین چشم انداز آینده را در میان انواع فن آوری های انرژی تجدید پذیر و پایدار دارا می باشد . جهت دستیابی به بیشترین و اقتصادی ترین انرژی از توربین باد ، می باید کارایی پره مورد ملاحضه قرار گیرد . \r\nدر این تحقیق نتایج شبیه سازی ایرودینامیکی انجام شده بر اساس جریان پایایی است که با سرعت پایین از روی ایرفویل های NREL S809 ، DU84-32 ، NACA 63-415 ، FFA-W3-211 و Wortmann FX 66-S-196 به صورت دو بعدی عبور می نماید . شبیه سازی صورت گرفته به کمک دینامیک سیالات محاسباتی توسط نرم افزار ANSYS CFX صورت پذیرفته است . شرایط بادی در این تحقیق با توجه به سرعت های باد در سایت های مختلف ایران می باشد . مدل توربولانسی در این تحقیق انتقال از جریان آرام به آشفته را لحاظ می نماید . نیرو های برآ و پسا ، پارامترهای مهمی در مطالعه بر روی کارایی توربین های بادی هستند . جهت دستیابی به بیشترین قدرت از توربین بادی ، بیشترین نسبت لغزش ( برآ به پسا )هدف است . کارایی پروفیل پره های گوناگون در سرعت های مختلف مورد بررسی قرار گرفته و بهینه ترین پره بر اساس بیشترین نسبت لغزش در هر سرعت محاسبه می شود . همچ"
- source_sentence: >-
query: علم مواد چگونه میتواند به بهبود خواص مکانیکی مواد در صنایع مختلف
کمک کند و چه تحقیقات جدیدی در این زمینه انجام شده است؟
sentences:
- >-
passage: آسیب فرآیندی است برگشت ناپذیر که با کاهش تدریجی مقاومت مکانیکی،
زوال ماده را به دنبال دارد. مکانیک آسیب شاخهای از مکانیک جامدات است که
عوامل مکانیکی ناظر بر گسیختگی ماده تحت بارگذاریهای مختلف را مورد مطالعه
قرار میدهد. خستگی گونه ای از آسیب بوده که می تواند منجر به شکست ناگهانی
قطعات گردد. بارگذاری خستگی در اثر تنش های چرخه ای که کمتر از تنش کششی
نهایی یا حتی تنش تسلیم هستند، نتیجه می شود. نام خستگی بر اساس این مفهوم
است که یک ماده تحت بارگذاری تکرار شونده خسته شده و در سطح تنش زیر مقاومت
اسمی ماده وامانده می شود. عمر خستگی یک قطعه می تواند به صورت تعداد چرخه
های بارگذاری لازم برای شروع یک ترک و گسترش آن تا اندازه بحرانی بیان شود.
بنابراین می توان گفت که واماندگی خستگی در سه مرحله اتفاق می افتد: شروع
ترک، رشد ترک آهسته-پایدار و شکست سریع. برای شروع ترک های خستگی سه عامل
اساسی لازم است: اولاً الگوی بارگذاری باید شامل مقادیر اوج بیشینه و کمینه
با اختلاف یا نوسان به حد کافی بزرگ باشد. مقادیر اوج ممکن است در کشش یا
فشار بوده و یا بر حسب زمان تغییر کنند، اما چرخه بارگذاری معکوس شونده برا
- >-
passage: خاک یکی از اساسیترین و مهمترین ماده در زندگی انسان ها میباشد،
در علم مهندسی عمران تمام ساخت و سازها یا روی آن و یا در درون آن انجام
مییابد. امروزه در بسیاری از شهرهای مهم تقاضا برای ساخت تونل برای اهداف
مختلف مانند حمل و نقل یا سیستم فاضلاب، افزایش یافته که ناشی از محدودیت
فضا و نگرانیهای محیط زیستی است. در این میان با گودبرداریهای ژرف برای
ساخت سازههای بلند و یا سایر اهداف، ممکن است باعث ایجاد تأثیراتی در
سازههای مجاور آن مانند تونل شود. در این پایاننامه به ارزیابی و بررسی
تأثیر گودبرداری ژرف بر روی تونل موجود پرداخته میشود که چه تأثیری روی
جابجایی و تغییرشکل تونل دارد و همچنین چه مقدار نیروی محوری و لنگر خمشی
داخلی اضافی در آن القا میشود که قبلاً برای آن طراحی نشده است که در
نهایت باعث اختلال در خدمت رسانی تونل شود. در این زمینه، توسط محققین
مختلف، تحقیقاتی انجام گرفته و برخی عوامل و پارامترهای موثر، مورد شناسایی
قرار گرفته است. هدف اصلی این تحقیق، بررسی پارامترهای دخیل در میزان تأثیر
گودبرداریهای عمیق بر روی تونلهای موجود در مجاورت آن میباشد که با
استفاده از روشهای ع
- >-
passage: به منظور شناسایی قارچهای عامل لکه دودهای و فضله مگسی در
استان گیلان، نمونههای مشکوک و دارای علائم از نقاط مختلف استان گیلان طی
ماه های تیر الی مهر 92 و 93، جمع آوری و مورد بررسی قرار گرفتند. این
قارچها پس از بررسیهای ریخت شناسی، با بهرهگیری از نوشتهها و منابع
معتبر موجود شناسایی شدند. براساس نتایج به دست آمده گونههای
Microcyclosporella mali،Zasmidium sp. و Zygophiala jamaicensis شناسایی
شدند. براساس خصوصیات مرفولوژیکی و توالی نواحی ITS و TEF،
احتمالاZasmidium sp. گونه جدیدی میباشد. گونهZasmidium sp. با داشتن
کنیدیوفورهای بلند، راست تا کمی خمیده، کنیدیومهای متنوع در شکل و اندازه
و وجود راماکنیدیومهای اولیه از بقیه گونههای نزدیک (Z. angulare، Z.
cellare، Z. noxoci و Z. citri) متمایز میگردد. همه این گونهها از روی
میوههای آلوده سیب، گلابی و خوج (گلابی محلی در استان گیلان) در استان
گیلان جداسازی و خالص سازی شدند و برای اولین بار از ایران گزارش میشوند.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- pearson_cosine
- spearman_cosine
model-index:
- name: SentenceTransformer based on intfloat/multilingual-e5-large
results:
- task:
type: semantic-similarity
name: Semantic Similarity
dataset:
name: sts validation
type: sts-validation
metrics:
- type: pearson_cosine
value: 0.8942762599448963
name: Pearson Cosine
- type: spearman_cosine
value: 0.8919015410349642
name: Spearman Cosine
SentenceTransformer based on intfloat/multilingual-e5-large
This is a sentence-transformers model finetuned from intfloat/multilingual-e5-large. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: intfloat/multilingual-e5-large
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 1024 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'query: علم مواد چگونه می\u200cتواند به بهبود خواص مکانیکی مواد در صنایع مختلف کمک کند و چه تحقیقات جدیدی در این زمینه انجام شده است؟',
'passage: آسیب فرآیندی است برگشت ناپذیر که با کاهش تدریجی مقاومت مکانیکی، زوال ماده را به دنبال دارد. مکانیک آسیب شاخه\u200cای از مکانیک جامدات است که عوامل مکانیکی ناظر بر گسیختگی ماده تحت بارگذاری\u200cهای مختلف را مورد مطالعه قرار می\u200cدهد. خستگی گونه ای از آسیب بوده که می تواند منجر به شکست ناگهانی قطعات گردد. بارگذاری خستگی در اثر تنش های چرخه ای که کمتر از تنش کششی نهایی یا حتی تنش تسلیم هستند، نتیجه می شود. نام خستگی بر اساس این مفهوم است که یک ماده تحت بارگذاری تکرار شونده خسته شده و در سطح تنش زیر مقاومت اسمی ماده وامانده می شود. عمر خستگی یک قطعه می تواند به صورت تعداد چرخه های بارگذاری لازم برای شروع یک ترک و گسترش آن تا اندازه بحرانی بیان شود. بنابراین می توان گفت که واماندگی خستگی در سه مرحله اتفاق می افتد: شروع ترک، رشد ترک آهسته-پایدار و شکست سریع. برای شروع ترک های خستگی سه عامل اساسی لازم است: اولاً الگوی بارگذاری باید شامل مقادیر اوج بیشینه و کمینه با اختلاف یا نوسان به حد کافی بزرگ باشد. مقادیر اوج ممکن است در کشش یا فشار بوده و یا بر حسب زمان تغییر کنند، اما چرخه بارگذاری معکوس شونده برا',
'passage: به منظور شناسایی قارچ\u200cهای عامل لکه دوده\u200cا\u200cی و فضله\u200c مگسی در استان گیلان، نمونه\u200cهای مشکوک و دارای علائم از نقاط مختلف استان گیلان طی ماه های تیر الی مهر 92 و 93، جمع آوری و مورد بررسی قرار گرفتند. این قارچ\u200cها پس از بررسی\u200cهای ریخت شناسی، با بهره\u200cگیری از نوشته\u200cها و منابع معتبر موجود شناسایی شدند. براساس نتایج به دست آمده گونه\u200cهای Microcyclosporella mali،Zasmidium sp. و Zygophiala jamaicensis شناسایی شدند. براساس خصوصیات مرفولوژیکی و توالی نواحی ITS و TEF، احتمالاZasmidium sp. گونه جدیدی می\u200cباشد. گونهZasmidium sp. با داشتن کنیدیوفورهای بلند، راست تا کمی خمیده، کنیدیوم\u200cهای متنوع در شکل و اندازه و وجود راماکنیدیوم\u200cهای اولیه از بقیه گونه\u200cهای نزدیک (Z. angulare، Z. cellare، Z. noxoci و Z. citri) متمایز می\u200cگردد. همه این گونه\u200cها از روی میوه\u200cهای آلوده سیب، گلابی و خوج (گلابی محلی در استان گیلان) در استان گیلان جداسازی و خالص سازی شدند و برای اولین بار از ایران گزارش می\u200cشوند.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Semantic Similarity
- Dataset:
sts-validation
- Evaluated with
EmbeddingSimilarityEvaluator
Metric | Value |
---|---|
pearson_cosine | 0.8943 |
spearman_cosine | 0.8919 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 31,837 training samples
- Columns:
sentence_0
,sentence_1
, andlabel
- Approximate statistics based on the first 1000 samples:
sentence_0 sentence_1 label type string string float details - min: 15 tokens
- mean: 25.87 tokens
- max: 46 tokens
- min: 67 tokens
- mean: 268.53 tokens
- max: 344 tokens
- min: 0.0
- mean: 0.57
- max: 1.0
- Samples:
sentence_0 sentence_1 label query: روشهای فتوگرامتری چگونه به بهبود دقت مدلهای عوارض در مناطق شهری کمک میکنند؟
passage: روشهای فتوگرامتری و سنجش از دور با توجه به وسعت منطقه تحت پوشش از یک طرف و نیز دقت قابل قبول این روشها از طرف دیگر، به عنوان روشهای مناسب جهت تولید و بهنگام رسانی اطلاعات مکانی شناخته شدهاند. در حال حاضر یکی از زمینههای تحقیقاتی مهم در این رابطه کاهش نقش اپراتور انسانی در استخراج و بازسازی مدل عوارض از دادههای مختلفی چون تصویر رقومی و داده-های ارتفاعی با بکارگیری الگوریتمهای مختلف پردازش تصویر است.
با توجه به تعداد زیاد ساختمانها در مناطق شهری دستیابی به یک مدل یا الگوریتم جهت استخراج و بازسازی اتوماتیک این عارضه از دادههای هوایی و ماهوارهای میتواند نقش انسان را در تولید اطلاعات مکانی بزرگ مقیاس شهری به حداقل رسانده و هزینه و زمان تولید آنها را به شدت کاهش دهد. منحنیهای پویا به عنوان یکی از روشهای مبتنی بر مدلهای ریاضی با بکارگیری اطلاعات گرادیان و یا اطلاعات طیفی تصویر، یکی از روشهای پرکاربرد در زمینه استخراج اتوماتیک عوارض از تصویر به شمار میروند. یکی از مشکلات اغلب مدلهای منحنیهای پویا موجود در زمینه استخراج ساختمان، عدم استفاده از اطلاعات و هوش انسانی د...1.0
query: نتایج اصلی این تحقیق چه تأثیری بر روند شیرینسازی گاز طبیعی دارند؟
passage: استفاده از غشا به منظور شیرینسازی گاز طیبعی یکی از فرآیندهای اساسی است که در سالهای اخیر مورد توجه فراوانی قرار گرفته است. مطالعات انجام شده نشان میدهد که غشاهای شبکه آمیخته از پتانسیل بالایی در این زمینه برخوردارند. در این پژوهش غشاهای جداسازی گاز آمیزهای پلیایمید/ پلیاتیلن گلایکول و شبکه آمیختهای پلیایمید/ پلیاتیلن گلایکول- زئولیت ZSM-5 به روش تبخیر حلال تهیه گردیدند. با افزایش 5-1 درصد وزنی پلیاتیلن گلایکول تروایی گاز دیاکسید کربن و گزینشپذیری زوج گاز دیاکسید کربن/ متان در فشار 10 بار از Barrer 6898/7 و 7419/33 در غشای ماتریمید خالص به Barrer 5748/9 و 8452/39 در غشای حاوی %5 پلیاتیلن گلایکول افزایش یافت. آزمون FT-IR وجود پیوندهای ضعیف هیدروژنی میان دو پلیمر و آزمون DSC نیمه امتزاجپذیر بودن آمیزههای پلیمری را نشان دادند. نتایج آزمون SEM افزایش تخلخل غشا را با افزایش درصد وزنی پلیاتیلن گلایکول تائید کرد. از زئولیت ZSM-5 کلسینه شده به منظور ساخت غشاهای شبکه آمیخته استفاده شد. حضور همزمان پلیاتیلن گلایکول و زئولیت ZSM-5 تا %5 وزنی در شبکه پلیایمیدی، افزایش قا...
1.0
query: فرآیند پیشسرمایش چگونه میتواند بر روی دیگر محصولات باغی نیز تأثیر بگذارد؟
passage: از جمله عملیاتی که نقش موثری در افزایش عمر قفسهای و کاهش ضایعات محصولات باغی دارد، فرآیند پیشسرمایش است. علیرغم اینکه در حال حاضر فرآیند پیشسرمایش در سطح دنیا بر روی توتفرنگی انجام میشود، ولی افت این محصول به دلیل سرمایش غیریکنواخت، هنوز قابل توجه است. هدف از این تحقیق، توسعه سامانه جدید برای پیشسرمایش توتفرنگی است که بتواند غیریکنواختی سرمایش میوهها را به حداقل برساند که نتیجه آن کاهش افت محصول و مصرف انرژی فرآیند است. در این تحقیق، ابتدا با حل معادلات پیوستگی و انتقال ممنتوم برای فاز سیال و انتقال گرما برای فاز سیال و محصول بصورت توام و به روش اجزای محدود در محیط نرمافزار COMSOL MULTIPHYSICS و در فضای جعبههای طراحی شده، الگوی جریان هوا در داخل جعبهها و سینی حاوی جعبهها به صورت سه بعدی شبیهسازی شد. با اعمال تغییرات مناسب در طراحی جعبه، سینی و الگوی هوادهی، سامانه جدیدی تحت عنوان سامانه پیشسرمایش موازی برای توتفرنگی معرفی گردید که قادر است هوای سرد را بصورت یکنواخت و با دمای یکسان به کلیه جعبهها در داخل هر سینی انتقال دهد و موجب سرمایش یکنواخت میوهها در جعبه...
0.6666666666666666
- Loss:
CosineSimilarityLoss
with these parameters:{ "loss_fct": "torch.nn.modules.loss.MSELoss" }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsnum_train_epochs
: 1multi_dataset_batch_sampler
: round_robin
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 8per_device_eval_batch_size
: 8per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 5e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1num_train_epochs
: 1max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.0warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: batch_samplermulti_dataset_batch_sampler
: round_robin
Training Logs
Epoch | Step | Training Loss | sts-validation_spearman_cosine |
---|---|---|---|
0.1256 | 500 | 0.0613 | 0.8480 |
0.2513 | 1000 | 0.0376 | 0.8698 |
0.3769 | 1500 | 0.0341 | 0.8751 |
0.5025 | 2000 | 0.0308 | 0.8780 |
0.6281 | 2500 | 0.0296 | 0.8837 |
0.7538 | 3000 | 0.0281 | 0.8892 |
0.8794 | 3500 | 0.0289 | 0.8888 |
1.0 | 3980 | - | 0.8919 |
Framework Versions
- Python: 3.10.12
- Sentence Transformers: 4.1.0
- Transformers: 4.52.4
- PyTorch: 2.7.1+cu118
- Accelerate: 1.7.0
- Datasets: 3.6.0
- Tokenizers: 0.21.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}