Spaces:

mackenzietechdocs
/

ml-sensei-chat

Sleeping

App Files Files Community

ml-sensei-chat / app.py

mackenzietechdocs

bug

71426d8 9 days ago

raw

history blame contribute delete

16.4 kB

	import torch
	from transformers import AutoModelForCausalLM, AutoTokenizer
	from peft import PeftModel
	import gradio as gr
	import asyncio
	import atexit

	# Create and own a single event loop so teardown is clean on Spaces
	event_loop = asyncio.new_event_loop()
	asyncio.set_event_loop(event_loop)

	# Make loop destructor safe (prevents Invalid file descriptor spam on shutdown.)
	def _safe_loop_del(self): # pragma: no cover
	try:
	if not self.is_closed():
	self.close()
	except Exception:
	pass

	asyncio.BaseEventLoop.__del__ = _safe_loop_del

	def _close_event_loop():
	if event_loop.is_running():
	event_loop.call_soon_threadsafe(event_loop.stop)
	if not event_loop.is_closed():
	event_loop.close()

	atexit.register(_close_event_loop)

	BASE_MODEL = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
	LORA_REPO = "mackenzietechdocs/ml-sensei-lora-tinyllama-1.1b"

	DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
	DTYPE = torch.bfloat16 if torch.cuda.is_available() else torch.float32

	print("🔹 Loading tokenizer...")
	tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
	if tokenizer.pad_token is None:
	tokenizer.pad_token = tokenizer.eos_token

	print("🔹 Loading base model...")
	base_model = AutoModelForCausalLM.from_pretrained(
	BASE_MODEL,
	torch_dtype=DTYPE,
	device_map={"": DEVICE}, # keep model on a single device (CPU on basic Spaces)
	low_cpu_mem_usage=True,
	)

	print("🔹 Loading LoRA adapter...")
	model = PeftModel.from_pretrained(
	base_model,
	LORA_REPO,
	device_map={"": DEVICE}, # keep adapter on same device as base model
	torch_dtype=DTYPE,
	)
	model = model.to(DEVICE)
	model.eval()

	SYSTEM_PROMPT = (
	"You are ML Sensei, a calm, friendly machine learning tutor. "
	"Explain ML/AI concepts clearly using intuition, simple language, and examples."
	)

	@torch.no_grad()
	def generate_reply(chat_history, user_message, max_new_tokens=512, temperature=0.7, top_p=0.9):
	# chat_history: list of [user, assistant]
	messages = [
	{"role": "system", "content": SYSTEM_PROMPT}
	]
	for u, a in chat_history:
	messages.append({"role": "user", "content": u})
	if a:
	messages.append({"role": "assistant", "content": a})
	messages.append({"role": "user", "content": user_message})

	# Use TinyLlama's chat template
	prompt = tokenizer.apply_chat_template(
	messages,
	tokenize=False,
	add_generation_prompt=True,
	)

	inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=1536).to(DEVICE)

	output = model.generate(
	**inputs,
	max_new_tokens=max_new_tokens,
	do_sample=True,
	temperature=temperature,
	top_p=top_p,
	pad_token_id=tokenizer.eos_token_id,
	)

	# Only decode the newly generated tokens (after the input)
	new_tokens = output[0][inputs['input_ids'].shape[1]:]
	reply = tokenizer.decode(new_tokens, skip_special_tokens=True).strip()

	return reply

	def gradio_chat(user_message, history, max_new_tokens, temperature, top_p):
	# Gradio Chatbot typically returns list of (user, assistant) tuples.
	# Handle both tuple and dict formats defensively.
	history_messages = history or []

	def _as_text(content):
	# Gradio may wrap content as list of {"type": "text", "text": "..."} dicts
	if isinstance(content, list):
	return " ".join(
	c.get("text", "") if isinstance(c, dict) else str(c)
	for c in content
	)
	if isinstance(content, dict):
	return content.get("text", "") or str(content)
	return content

	history_pairs = []
	pending_user = None
	for msg in history_messages:
	if isinstance(msg, (list, tuple)) and len(msg) == 2:
	history_pairs.append((_as_text(msg[0]), _as_text(msg[1])))
	pending_user = None
	continue
	role = msg.get("role")
	content = _as_text(msg.get("content", ""))
	if role == "user":
	pending_user = content
	elif role == "assistant":
	history_pairs.append((pending_user or "", content))
	pending_user = None

	reply = generate_reply(
	history_pairs,
	user_message,
	max_new_tokens=int(max_new_tokens),
	temperature=float(temperature),
	top_p=float(top_p),
	)

	new_history_pairs = history_pairs + [(user_message, reply)]

	return "", new_history_pairs

	# Custom CSS for messenger-style UI with peach/pink theme
	custom_css = """
	/* Main gradient background */
	.gradio-container {
	background: linear-gradient(135deg, #FFB88C 0%, #FF9A8B 50%, #FF6A88 100%) !important;
	font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, sans-serif;
	}

	/* Chatbot container - transparent to show gradient */
	.chatbot {
	border: none !important;
	background: transparent !important;
	}

	/* Make ALL chatbot area elements transparent except message bubbles */
	[data-testid="chatbot"],
	[data-testid="chatbot"] > *,
	.chatbot div:not([data-testid="user"]):not([data-testid="bot"]),
	.chatbot > div > div,
	.chatbot [class*="wrap"],
	.chatbot [class*="container"]:not([data-testid="user"]):not([data-testid="bot"]) {
	background: transparent !important;
	background-color: transparent !important;
	border: none !important;
	box-shadow: none !important;
	}

	/* User message bubble - light grey (only the outermost container) */
	[data-testid="user"] {
	background: #E8E8E8 !important;
	color: #000000 !important;
	border: none !important;
	border-radius: 20px 20px 4px 20px !important;
	padding: 14px 18px !important;
	margin: 8px 20px 8px auto !important;
	max-width: 70% !important;
	min-width: 100px !important;
	box-shadow: 0 2px 8px rgba(0, 0, 0, 0.1) !important;
	outline: none !important;
	display: inline-block !important;
	}

	/* All children of user bubble - transparent, NO borders, NO padding */
	[data-testid="user"] *,
	[data-testid="user"] div,
	[data-testid="user"] p,
	[data-testid="user"] > div,
	[data-testid="user"] [class*="message"],
	[data-testid="user"] [class*="wrap"],
	[data-testid="user"] [class*="container"] {
	background: transparent !important;
	background-color: transparent !important;
	border: none !important;
	border-width: 0 !important;
	border-style: none !important;
	padding: 0 !important;
	margin: 0 !important;
	outline: none !important;
	box-shadow: none !important;
	}

	/* Assistant message bubble - pink (only the outermost container) */
	[data-testid="bot"] {
	background: linear-gradient(135deg, #FFB3D9 0%, #FFAAD1 100%) !important;
	color: #000000 !important;
	border: none !important;
	border-width: 0 !important;
	border-style: none !important;
	border-radius: 20px 20px 20px 4px !important;
	padding: 14px 18px !important;
	margin: 8px auto 8px 20px !important;
	max-width: 70% !important;
	min-width: 100px !important;
	box-shadow: 0 2px 8px rgba(255, 106, 136, 0.2) !important;
	outline: none !important;
	display: inline-block !important;
	}

	/* All children of bot bubble - transparent, NO borders, NO padding */
	[data-testid="bot"] *,
	[data-testid="bot"] div,
	[data-testid="bot"] p,
	[data-testid="bot"] > div,
	[data-testid="bot"] [class*="message"],
	[data-testid="bot"] [class*="wrap"],
	[data-testid="bot"] [class*="container"] {
	background: transparent !important;
	background-color: transparent !important;
	border: none !important;
	border-width: 0 !important;
	border-style: none !important;
	padding: 0 !important;
	margin: 0 !important;
	outline: none !important;
	box-shadow: none !important;
	}

	/* Force all text to be black everywhere in chatbot */
	.chatbot,
	.chatbot *,
	[data-testid="user"],
	[data-testid="user"] *,
	[data-testid="bot"],
	[data-testid="bot"] * {
	color: #000000 !important;
	}

	/* Input container */
	.input-row {
	background: rgba(255, 255, 255, 0.95) !important;
	border-radius: 28px !important;
	padding: 8px !important;
	box-shadow: 0 4px 16px rgba(0, 0, 0, 0.1) !important;
	border: none !important;
	}

	/* Remove all borders from EVERYTHING in input area */
	.input-row,
	.input-row *,
	.input-row div,
	.input-row label,
	.input-row .block,
	.input-row .wrap,
	.input-row [class*="wrap"],
	.input-row [class*="container"],
	.input-row fieldset,
	.input-row > * {
	border: none !important;
	outline: none !important;
	box-shadow: none !important;
	}

	/* Input box wrapper - absolutely no borders */
	.input-box,
	.input-box > *,
	.input-box *,
	.input-box div,
	.input-box .wrap,
	.input-box [class*="wrap"],
	.input-box [class*="container"],
	.input-box fieldset {
	border: none !important;
	outline: none !important;
	box-shadow: none !important;
	background: transparent !important;
	}

	.input-box textarea {
	background: white !important;
	color: #000000 !important;
	border-radius: 20px !important;
	padding: 12px 20px !important;
	font-size: 15px !important;
	box-shadow: 0 1px 4px rgba(0, 0, 0, 0.05) !important;
	}

	.input-box textarea::placeholder {
	color: #999 !important;
	}

	.input-box textarea:focus {
	border: 2px solid #FF6A88 !important;
	outline: none !important;
	}

	/* Send button */
	.send-button {
	background: linear-gradient(135deg, #FF6A88 0%, #FF8C94 100%) !important;
	color: white !important;
	border: none !important;
	border-radius: 20px !important;
	padding: 12px 28px !important;
	font-weight: 600 !important;
	font-size: 15px !important;
	cursor: pointer !important;
	transition: all 0.3s ease !important;
	box-shadow: 0 3px 10px rgba(255, 106, 136, 0.3) !important;
	min-width: 90px !important;
	}

	.send-button:hover {
	transform: translateY(-2px) !important;
	box-shadow: 0 5px 14px rgba(255, 106, 136, 0.4) !important;
	}

	/* Settings panel */
	.settings-panel {
	background: rgba(255, 255, 255, 0.95) !important;
	border-radius: 20px !important;
	padding: 24px !important;
	box-shadow: 0 8px 32px rgba(0, 0, 0, 0.1) !important;
	}

	/* Force all settings panel children to have white/transparent backgrounds */
	.settings-panel *,
	.settings-panel div,
	.settings-panel .block,
	.settings-panel .wrap {
	background: transparent !important;
	background-color: transparent !important;
	}

	/* Force all text in settings panel to be black */
	.settings-panel h3,
	.settings-panel h3 *,
	.settings-panel label,
	.settings-panel label *,
	.settings-panel span,
	.settings-panel p,
	.settings-panel .info,
	.settings-panel * {
	color: #000000 !important;
	}

	.settings-panel h3 {
	margin-bottom: 20px !important;
	}

	/* Slider labels */
	.settings-panel label {
	font-weight: 600 !important;
	font-size: 14px !important;
	}

	/* Slider info text */
	.settings-panel .info {
	color: #666 !important;
	font-size: 12px !important;
	}

	/* Slider styling */
	input[type="range"] {
	accent-color: #FF6A88 !important;
	}

	/* Slider containers - force transparent */
	.settings-panel .slider-container,
	.settings-panel [class*="slider"],
	.settings-panel [class*="wrap"] {
	background: transparent !important;
	border: none !important;
	}

	/* Header */
	.header-title {
	color: white !important;
	text-align: center !important;
	font-size: 2.5em !important;
	font-weight: 700 !important;
	margin-bottom: 8px !important;
	text-shadow: 2px 2px 4px rgba(0, 0, 0, 0.15) !important;
	}

	.header-subtitle {
	color: rgba(255, 255, 255, 0.95) !important;
	text-align: center !important;
	font-size: 1.1em !important;
	margin-bottom: 20px !important;
	text-shadow: 1px 1px 2px rgba(0, 0, 0, 0.1) !important;
	}

	/* Hide ALL progress bars everywhere */
	.progress,
	.progress-bar,
	.generating,
	[class*="progress"],
	div[class*="progress"],
	.chatbot .progress,
	.input-row .progress,
	.input-box .progress,
	.wrap .progress,
	.gradio-container .progress {
	display: none !important;
	visibility: hidden !important;
	opacity: 0 !important;
	height: 0 !important;
	overflow: hidden !important;
	}

	/* Static progress/status container */
	.progress-container {
	margin-top: 12px !important;
	background: rgba(255, 255, 255, 0.9) !important;
	border-radius: 12px !important;
	padding: 10px 20px !important;
	box-shadow: 0 2px 8px rgba(0, 0, 0, 0.05) !important;
	min-height: 36px !important;
	}

	.progress-container div {
	background: transparent !important;
	}

	/* Scrollbar */
	::-webkit-scrollbar {
	width: 8px;
	}

	::-webkit-scrollbar-track {
	background: rgba(255, 255, 255, 0.2);
	border-radius: 10px;
	}

	::-webkit-scrollbar-thumb {
	background: rgba(255, 106, 136, 0.6);
	border-radius: 10px;
	}

	::-webkit-scrollbar-thumb:hover {
	background: rgba(255, 106, 136, 0.8);
	}

	/* Footer text - make black */
	footer,
	footer *,
	footer p,
	footer a,
	footer span,
	.footer,
	.footer *,
	[class*="footer"],
	[class="footer"] {
	color: #000000 !important;
	}

	/* Chat control buttons - down arrow and delete button - make pink */
	.chatbot button,
	.chatbot [role="button"],
	.chatbot svg,
	[data-testid="chatbot"] button,
	[data-testid="chatbot"] [role="button"],
	[data-testid="chatbot"] svg,
	.chatbot button svg,
	.chatbot button path,
	[data-testid="chatbot"] button svg,
	[data-testid="chatbot"] button path {
	color: #FF6A88 !important;
	fill: #FF6A88 !important;
	stroke: #FF6A88 !important;
	}

	/* Ensure button backgrounds are transparent */
	.chatbot button,
	[data-testid="chatbot"] button {
	background: transparent !important;
	border: none !important;
	}
	"""

	with gr.Blocks() as demo:
	# Inject CSS manually (gradio 6.0.2 removed the `css` kwarg on Blocks)
	gr.HTML(f"<style>{custom_css}</style>")
	# Header
	gr.HTML("""
	<div style="text-align: center; margin-bottom: 20px;">
	<h1 class="header-title">🥋 ML Sensei Chat</h1>
	<p class="header-subtitle">Your friendly AI tutor for Machine Learning & Deep Learning</p>
	</div>
	""")

	with gr.Row():
	# Main chat area
	with gr.Column(scale=3):
	chat = gr.Chatbot(
	height=550,
	show_label=False,
	avatar_images=(None, "ml-chat.png"),
	elem_classes="chatbot",
	)

	# Settings sidebar
	with gr.Column(scale=1, elem_classes="settings-panel"):
	gr.Markdown("### ⚙️ AI Settings")

	max_tokens = gr.Slider(
	64, 1536,
	value=800,
	step=16,
	label="🔢 Max Tokens",
	info="Response length"
	)

	temperature = gr.Slider(
	0.1, 1.5,
	value=0.7,
	step=0.1,
	label="🌡️ Temperature",
	info="Creativity level"
	)

	top_p = gr.Slider(
	0.1, 1.0,
	value=0.9,
	step=0.05,
	label="🎯 Top-p",
	info="Diversity control"
	)

	gr.Markdown("---")
	gr.Markdown("""
	<div style="text-align: center; color: #666; font-size: 0.85em;">
	<p><strong>TinyLlama LoRA</strong></p>
	<p>Powered by 🦙</p>
	</div>
	""")

	# Input area below chat
	with gr.Row(elem_classes="input-row"):
	user_input = gr.Textbox(
	show_label=False,
	placeholder="💬 Ask ML Sensei about ML / DL / AI...",
	container=False,
	scale=5,
	elem_classes="input-box"
	)
	send_btn = gr.Button("Send", scale=1, elem_classes="send-button")

	# Status indicator below input
	with gr.Row(elem_classes="progress-container"):
	status = gr.HTML(value="<div style='text-align: center; color: #666; font-size: 13px;'>Ready to chat!</div>")

	send_btn.click(
	gradio_chat,
	inputs=[user_input, chat, max_tokens, temperature, top_p],
	outputs=[user_input, chat],
	)
	user_input.submit(
	gradio_chat,
	inputs=[user_input, chat, max_tokens, temperature, top_p],
	outputs=[user_input, chat],
	)

	# Use queue + main guard to avoid async loop shutdown warnings on exit (HF Spaces)
	if __name__ == "__main__":
	demo.queue().launch()