FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9638, 451 aa 1>>>pF1KB9638 451 - 451 aa - 451 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.9144+/-0.000834; mu= 10.5481+/- 0.051 mean_var=285.5313+/-59.364, 0's: 0 Z-trim(116.8): 51 B-trim: 0 in 0/52 Lambda= 0.075901 statistics sampled from 17434 (17483) to 17434 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.8), E-opt: 0.2 (0.537), width: 16 Scan time: 3.090 The best scores are: opt bits E(32554) CCDS30679.1 POU3F1 gene_id:5453|Hs108|chr1 ( 451) 3199 363.2 3e-100 CCDS33265.1 POU3F3 gene_id:5455|Hs108|chr2 ( 500) 1240 148.8 1.2e-35 CCDS5040.1 POU3F2 gene_id:5454|Hs108|chr6 ( 443) 1183 142.4 8.6e-34 CCDS14450.1 POU3F4 gene_id:5456|Hs108|chrX ( 361) 983 120.4 3e-27 CCDS8431.1 POU2F3 gene_id:25833|Hs108|chr11 ( 436) 701 89.7 6.6e-18 CCDS58190.1 POU2F3 gene_id:25833|Hs108|chr11 ( 438) 701 89.7 6.6e-18 CCDS55655.1 POU2F1 gene_id:5451|Hs108|chr1 ( 703) 672 86.8 7.9e-17 CCDS55656.1 POU2F1 gene_id:5451|Hs108|chr1 ( 755) 672 86.8 8.3e-17 CCDS1259.2 POU2F1 gene_id:5451|Hs108|chr1 ( 766) 672 86.8 8.3e-17 CCDS34391.1 POU5F1 gene_id:5460|Hs108|chr6 ( 360) 651 84.1 2.6e-16 CCDS55274.1 POU5F1B gene_id:5462|Hs108|chr8 ( 359) 634 82.2 9.5e-16 CCDS31996.1 POU4F1 gene_id:5457|Hs108|chr13 ( 419) 631 82.0 1.3e-15 CCDS46873.1 POU1F1 gene_id:5449|Hs108|chr3 ( 317) 610 79.5 5.4e-15 CCDS2919.1 POU1F1 gene_id:5449|Hs108|chr3 ( 291) 604 78.8 8.1e-15 CCDS34074.1 POU4F2 gene_id:5458|Hs108|chr4 ( 409) 526 70.5 3.7e-12 CCDS47398.2 POU5F1 gene_id:5460|Hs108|chr6 ( 190) 515 68.8 5.4e-12 CCDS4281.1 POU4F3 gene_id:5459|Hs108|chr5 ( 338) 508 68.4 1.3e-11 CCDS59489.1 POU5F2 gene_id:134187|Hs108|chr5 ( 328) 488 66.2 5.8e-11 >>CCDS30679.1 POU3F1 gene_id:5453|Hs108|chr1 (451 aa) initn: 3199 init1: 3199 opt: 3199 Z-score: 1913.1 bits: 363.2 E(32554): 3e-100 Smith-Waterman score: 3199; 100.0% identity (100.0% similar) in 451 aa overlap (1-451:1-451) 10 20 30 40 50 60 pF1KB9 MATTAQYLPRGPGGGAGGTGPLMHPDAAAAAAAAAAAERLHAGAAYREVQKLMHHEWLGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 MATTAQYLPRGPGGGAGGTGPLMHPDAAAAAAAAAAAERLHAGAAYREVQKLMHHEWLGA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 GAGHPVGLAHPQWLPTGGGGGGDWAGGPHLEHGKAGGGGTGRADDGGGGGGFHARLVHQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 GAGHPVGLAHPQWLPTGGGGGGDWAGGPHLEHGKAGGGGTGRADDGGGGGGFHARLVHQG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 AAHAGAAWAQGSTAHHLGPAMSPSPGASGGHQPQPLGLYAQAAYPGGGGGGLAGMLAAGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 AAHAGAAWAQGSTAHHLGPAMSPSPGASGGHQPQPLGLYAQAAYPGGGGGGLAGMLAAGG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 GGAGPGLHHALHEDGHEAQLEPSPPPHLGAHGHAHGHAHAGGLHAAAAHLHPGAGGGGSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 GGAGPGLHHALHEDGHEAQLEPSPPPHLGAHGHAHGHAHAGGLHAAAAHLHPGAGGGGSS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 VGEHSDEDAPSSDDLEQFAKQFKQRRIKLGFTQADVGLALGTLYGNVFSQTTICRFEALQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 VGEHSDEDAPSSDDLEQFAKQFKQRRIKLGFTQADVGLALGTLYGNVFSQTTICRFEALQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 LSFKNMCKLKPLLNKWLEETDSSSGSPTNLDKIAAQGRKRKKRTSIEVGVKGALESHFLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LSFKNMCKLKPLLNKWLEETDSSSGSPTNLDKIAAQGRKRKKRTSIEVGVKGALESHFLK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 CPKPSAHEITGLADSLQLEKEVVRVWFCNRRQKEKRMTPAAGAGHPPMDDVYAPGELGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 CPKPSAHEITGLADSLQLEKEVVRVWFCNRRQKEKRMTPAAGAGHPPMDDVYAPGELGPG 370 380 390 400 410 420 430 440 450 pF1KB9 GGGASPPSAPPPPPPAALHHHHHHTLPGSVQ ::::::::::::::::::::::::::::::: CCDS30 GGGASPPSAPPPPPPAALHHHHHHTLPGSVQ 430 440 450 >>CCDS33265.1 POU3F3 gene_id:5455|Hs108|chr2 (500 aa) initn: 1088 init1: 1008 opt: 1240 Z-score: 753.3 bits: 148.8 E(32554): 1.2e-35 Smith-Waterman score: 1281; 50.5% identity (64.3% similar) in 493 aa overlap (11-451:39-500) 10 20 30 40 pF1KB9 MATTAQYLPRGPGGGAGGTGPLMHPDAAAAAAAAAAAERL : :::::: : :.: .::....: .. CCDS33 YLPGNSLLAAGSIVHSDAAGAGGGGGGGGGGGGGGAGGGGGGMQPGSAAVTSGAYRGD-- 10 20 30 40 50 60 50 60 70 80 pF1KB9 HAGAAYREVQK-LMHHEWLGAGAGHPVGLAHPQW---LPTGGGGGG-----------DWA .. . ::. .:. ....:: .. :: :: :: ...... :. CCDS33 --PSSVKMVQSDFMQGAMAASNGGHMLSHAH-QWVTALPHAAAAAAAAAAAAVEASSPWS 70 80 90 100 110 120 90 100 110 120 pF1KB9 GG---------------PHLEHGKAGGGGTGRADDGGGGGGFHARLV----------HQG :. : .: ::.:: :: .: ..: : ::: CCDS33 GSAVGMAGSPQQPPQPPPPPPQGPDVKGGAGR-DDLHAGTALHHRGPPHLGPPPPPPHQG 130 140 150 160 170 180 130 140 150 160 170 pF1KB9 AAHAGAAWAQGSTAHHLGPAMSPSPGASGGHQPQPLGL-YAQAAYPGGGGGGLAGMLAA- . .: : ...: . : . :. .::.:: : .: :.: ::: . :::.: CCDS33 HPGGWGAAAAAAAAAAAAAAAAHLPSMAGGQQPPPQSLLYSQ---PGGFT--VNGMLSAP 190 200 210 220 230 180 190 200 210 220 230 pF1KB9 -----GGGGAGPGLHHALHEDGHEAQLEPSPPPHLGAHGHAHGHAHAGGLHAAAAHLHPG :::::: : . .: : : : : : :.: : : : . : : CCDS33 PGPGGGGGGAGGGAQSLVHP-GLVRGDTPELAEH-HHHHHHHAHPHPPHPHHAQGPPHHG 240 250 260 270 280 290 240 250 260 270 280 pF1KB9 AGGGGSSVG-----EHSDEDAPSSDDLEQFAKQFKQRRIKLGFTQADVGLALGTLYGNVF .::::.. : :::::.:.::::::::::::::::::::::::::::::::::::: CCDS33 GGGGGAGPGLNSHDPHSDEDTPTSDDLEQFAKQFKQRRIKLGFTQADVGLALGTLYGNVF 300 310 320 330 340 350 290 300 310 320 330 340 pF1KB9 SQTTICRFEALQLSFKNMCKLKPLLNKWLEETDSSSGSPTNLDKIAAQGRKRKKRTSIEV :::::::::::::::::::::::::::::::.:::.::::..:::::::::::::::::: CCDS33 SQTTICRFEALQLSFKNMCKLKPLLNKWLEEADSSTGSPTSIDKIAAQGRKRKKRTSIEV 360 370 380 390 400 410 350 360 370 380 390 400 pF1KB9 GVKGALESHFLKCPKPSAHEITGLADSLQLEKEVVRVWFCNRRQKEKRMTPAAGAGHPPM .:::::::::::::::::.:::.:::::::::::::::::::::::::::: . . : CCDS33 SVKGALESHFLKCPKPSAQEITNLADSLQLEKEVVRVWFCNRRQKEKRMTPPGIQQQTP- 420 430 440 450 460 470 410 420 430 440 450 pF1KB9 DDVYAPGELGPGGGGASPPSAPPPPPPAALHHHHHHTLPGSVQ ::::. ..: :: ::: :: : ::: CCDS33 DDVYS--QVGT-------VSADTPPP--------HHGLQTSVQ 480 490 500 >>CCDS5040.1 POU3F2 gene_id:5454|Hs108|chr6 (443 aa) initn: 1163 init1: 995 opt: 1183 Z-score: 720.2 bits: 142.4 E(32554): 8.6e-34 Smith-Waterman score: 1238; 51.1% identity (65.0% similar) in 460 aa overlap (22-427:11-441) 10 20 30 40 50 60 pF1KB9 MATTAQYLPRGPGGGAGGTGPLMHPDAAAAAAAAAAAERLHAGAAYREVQKLMHHEWLGA :. .:. . : .. . ::. :::.:.:.. .. :: CCDS50 MATAASNHYSLLTSSASIVHAEPPGGMQQGAGG-YREAQSLVQGDY-GA 10 20 30 40 70 80 90 100 pF1KB9 --GAGHPVGLAHPQW---LPTGGGGGGDWAGGPHLEHGKAGGGGT--------------- . :::.. :: :: : :::::: .:: : .:: :. CCDS50 LQSNGHPLSHAH-QWITALSHGGGGGGGGGGGGGGGGGGGGGDGSPWSTSPLGQPDIKPS 50 60 70 80 90 100 110 120 pF1KB9 ------GRADDGGGGGGFHAR--------------------------LVHQGAAH--AGA ::.:. : :... . :::..: : . . CCDS50 VVVQQGGRGDELHGPGALQQQHQQQQQQQQQQQQQQQQQQQQQRPPHLVHHAANHHPGPG 110 120 130 140 150 160 130 140 150 160 170 180 pF1KB9 AWAQGSTAHHLGPAMSPSPGASGGHQPQPLGLYAQAAYPGGGGGGLAGMLAAGGGGAGPG :: ....: :: :.: :::.: ::.: .. . :::.::: : : CCDS50 AWRSAAAAAHLPPSM----GASNGGL-----LYSQPSFT------VNGMLGAGGQPA--G 170 180 190 200 190 200 210 220 230 240 pF1KB9 LHHALHEDGHEAQLEPSPPPHLGAHGHAHGHAHAGGLHAAAAHLHPGAGGGGSSVGEHSD ::: .:.:. : : : : :.: : . :: :. . ::: CCDS50 LHHHGLRDAHDE------PHHADHHPHPHSHPHQQPPPPPPPQGPPGHPGAHHD--PHSD 210 220 230 240 250 260 250 260 270 280 290 300 pF1KB9 EDAPSSDDLEQFAKQFKQRRIKLGFTQADVGLALGTLYGNVFSQTTICRFEALQLSFKNM ::.:.::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 EDTPTSDDLEQFAKQFKQRRIKLGFTQADVGLALGTLYGNVFSQTTICRFEALQLSFKNM 270 280 290 300 310 320 310 320 330 340 350 360 pF1KB9 CKLKPLLNKWLEETDSSSGSPTNLDKIAAQGRKRKKRTSIEVGVKGALESHFLKCPKPSA :::::::::::::.::::::::..::::::::::::::::::.::::::::::::::::: CCDS50 CKLKPLLNKWLEEADSSSGSPTSIDKIAAQGRKRKKRTSIEVSVKGALESHFLKCPKPSA 330 340 350 360 370 380 370 380 390 400 410 420 pF1KB9 HEITGLADSLQLEKEVVRVWFCNRRQKEKRMTPAAGAGHPPMDDVYAPGELGPGGGGASP .:::.:::::::::::::::::::::::::::: .:. : .:::. .. : :.. CCDS50 QEITSLADSLQLEKEVVRVWFCNRRQKEKRMTPPGGT-LPGAEDVYGGSRDTPPHHGVQT 390 400 410 420 430 440 430 440 450 pF1KB9 PSAPPPPPPAALHHHHHHTLPGSVQ : CCDS50 PVQ >>CCDS14450.1 POU3F4 gene_id:5456|Hs108|chrX (361 aa) initn: 1035 init1: 963 opt: 983 Z-score: 602.8 bits: 120.4 E(32554): 3e-27 Smith-Waterman score: 1064; 52.1% identity (68.4% similar) in 376 aa overlap (40-413:25-349) 10 20 30 40 50 60 pF1KB9 RGPGGGAGGTGPLMHPDAAAAAAAAAAAERLHAGAAYREVQKLMHHEWL-GAGA-GHPVG .. :. .:. :::.. ..: :. . :::.: CCDS14 MATAASNPYSILSSTSLVHADSAGMQQGSPFRNPQKLLQSDYLQGVPSNGHPLG 10 20 30 40 50 70 80 90 100 110 120 pF1KB9 LAHPQWLPTGGGGGGDWAGGPHLEHGKAGGGGTGRADDGGGGGGFHARLVHQGAAHAGAA : .:. :. . :: :.. :: : :. ..:. . :. : CCDS14 --H-HWV-TSLSDGGPWSSTLATSPLDQQDVKPGREDLQLGA------IIHHRSPHV--A 60 70 80 90 100 130 140 150 160 170 180 pF1KB9 WAQGSTAHHLGPAMSPSPGASGGHQPQPLGLYAQAAYPGGGGGGLAGMLAAGGGGAGPGL . : : . . ::.:. : . :::..:.: :: ..::: :: :. CCDS14 HHSPHTNHPNAWGASPAPNPSITSSGQPLNVYSQ---PG---FTVSGMLEHGGLTPPPAA 110 120 130 140 150 190 200 210 220 230 240 pF1KB9 HHALHEDGHEAQLEPSPPPHLGAHGHAHGHAHAGGLHAAAAHLHPGAGGGGSSVGEHSDE : .. : . :: .::.: : . .:::: CCDS14 ASA--QSLHPVLREPPDHGELGSH-HCQ---------------------------DHSDE 160 170 180 250 260 270 280 290 300 pF1KB9 DAPSSDDLEQFAKQFKQRRIKLGFTQADVGLALGTLYGNVFSQTTICRFEALQLSFKNMC ..:.::.::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ETPTSDELEQFAKQFKQRRIKLGFTQADVGLALGTLYGNVFSQTTICRFEALQLSFKNMC 190 200 210 220 230 240 310 320 330 340 350 360 pF1KB9 KLKPLLNKWLEETDSSSGSPTNLDKIAAQGRKRKKRTSIEVGVKGALESHFLKCPKPSAH ::::::::::::.:::.::::..::::::::::::::::::.:::.::.::::::::.:. CCDS14 KLKPLLNKWLEEADSSTGSPTSIDKIAAQGRKRKKRTSIEVSVKGVLETHFLKCPKPAAQ 250 260 270 280 290 300 370 380 390 400 410 420 pF1KB9 EITGLADSLQLEKEVVRVWFCNRRQKEKRMTPAAGAGHPPMDDVYAPGELGPGGGGASPP ::..:::::::::::::::::::::::::::: : .: .::. CCDS14 EISSLADSLQLEKEVVRVWFCNRRQKEKRMTPP-GDQQP--HEVYSHTVKTDTSCHDL 310 320 330 340 350 360 430 440 450 pF1KB9 SAPPPPPPAALHHHHHHTLPGSVQ >>CCDS8431.1 POU2F3 gene_id:25833|Hs108|chr11 (436 aa) initn: 705 init1: 383 opt: 701 Z-score: 435.0 bits: 89.7 E(32554): 6.6e-18 Smith-Waterman score: 707; 49.1% identity (67.6% similar) in 275 aa overlap (184-450:142-379) 160 170 180 190 200 210 pF1KB9 QPLGLYAQAAYPGGGGGGLAGMLAAGGGGAGPGLHHALHEDGHEAQLEPSPPPHLGAHGH :::: : . :: . : ::: : : CCDS84 LSQTQPGQQGLQPNLLPFPQQQSGLLLPQTGPGL--ASQAFGHPGLPGSSLEPHLEASQH 120 130 140 150 160 220 230 240 250 260 270 pF1KB9 AHGHAHAGGLHAAAAHLHPGAGGGGSSVGEHSDEDAPSS-DDLEQFAKQFKQRRIKLGFT . :: :..::. : ::. ..::.::: ::::::::::: CCDS84 L----------PVPKHL-PSSGGA----------DEPSDLEELEKFAKTFKQRRIKLGFT 170 180 190 200 280 290 300 310 320 pF1KB9 QADVGLALGTLYGNVFSQTTICRFEALQLSFKNMCKLKPLLNKWLEE-----TDSSSGSP :.:::::.: :::: :::::: :::::.:::::::::::::.:::.. .: : ..: CCDS84 QGDVGLAMGKLYGNDFSQTTISRFEALNLSFKNMCKLKPLLEKWLNDAESSPSDPSVSTP 210 220 230 240 250 260 330 340 350 360 370 380 pF1KB9 TNLDKIAAQ-GRKRKKRTSIEVGVKGALESHFLKCPKPSAHEITGLADSLQLEKEVVRVW .. ... :::::::::::.... .::..: ::::..::. .:..:..:::::::: CCDS84 SSYPSLSEVFGRKRKKRTSIETNIRLTLEKRFQDNPKPSSEEISMIAEQLSMEKEVVRVW 270 280 290 300 310 320 390 400 410 420 430 440 pF1KB9 FCNRRQKEKRMT-PAAGAGHPPMDDVYAPGELGPGGGGASPPSAPPPPPPAALHHHHHHT ::::::::::.. :.: .:: :: ..:.:. .: :.:: : : CCDS84 FCNRRQKEKRINCPVATPIKPP---VYNSRLVSPSGS-LGPLSVPPV----------HST 330 340 350 360 370 450 pF1KB9 LPGSVQ .::.: CCDS84 MPGTVTSSCSPGNNSRPSSPGSGLHASSPTASQNNSKAAVNSASSFNSSGSWYRWNHSTY 380 390 400 410 420 430 >>CCDS58190.1 POU2F3 gene_id:25833|Hs108|chr11 (438 aa) initn: 705 init1: 383 opt: 701 Z-score: 435.0 bits: 89.7 E(32554): 6.6e-18 Smith-Waterman score: 707; 49.1% identity (67.6% similar) in 275 aa overlap (184-450:144-381) 160 170 180 190 200 210 pF1KB9 QPLGLYAQAAYPGGGGGGLAGMLAAGGGGAGPGLHHALHEDGHEAQLEPSPPPHLGAHGH :::: : . :: . : ::: : : CCDS58 LSQTQPGQQGLQPNLLPFPQQQSGLLLPQTGPGL--ASQAFGHPGLPGSSLEPHLEASQH 120 130 140 150 160 170 220 230 240 250 260 270 pF1KB9 AHGHAHAGGLHAAAAHLHPGAGGGGSSVGEHSDEDAPSS-DDLEQFAKQFKQRRIKLGFT . :: :..::. : ::. ..::.::: ::::::::::: CCDS58 L----------PVPKHL-PSSGGA----------DEPSDLEELEKFAKTFKQRRIKLGFT 180 190 200 210 280 290 300 310 320 pF1KB9 QADVGLALGTLYGNVFSQTTICRFEALQLSFKNMCKLKPLLNKWLEE-----TDSSSGSP :.:::::.: :::: :::::: :::::.:::::::::::::.:::.. .: : ..: CCDS58 QGDVGLAMGKLYGNDFSQTTISRFEALNLSFKNMCKLKPLLEKWLNDAESSPSDPSVSTP 220 230 240 250 260 270 330 340 350 360 370 380 pF1KB9 TNLDKIAAQ-GRKRKKRTSIEVGVKGALESHFLKCPKPSAHEITGLADSLQLEKEVVRVW .. ... :::::::::::.... .::..: ::::..::. .:..:..:::::::: CCDS58 SSYPSLSEVFGRKRKKRTSIETNIRLTLEKRFQDNPKPSSEEISMIAEQLSMEKEVVRVW 280 290 300 310 320 330 390 400 410 420 430 440 pF1KB9 FCNRRQKEKRMT-PAAGAGHPPMDDVYAPGELGPGGGGASPPSAPPPPPPAALHHHHHHT ::::::::::.. :.: .:: :: ..:.:. .: :.:: : : CCDS58 FCNRRQKEKRINCPVATPIKPP---VYNSRLVSPSGS-LGPLSVPPV----------HST 340 350 360 370 450 pF1KB9 LPGSVQ .::.: CCDS58 MPGTVTSSCSPGNNSRPSSPGSGLHASSPTASQNNSKAAVNSASSFNSSGSWYRWNHSTY 380 390 400 410 420 430 >>CCDS55655.1 POU2F1 gene_id:5451|Hs108|chr1 (703 aa) initn: 714 init1: 371 opt: 672 Z-score: 415.6 bits: 86.8 E(32554): 7.9e-17 Smith-Waterman score: 677; 54.4% identity (77.7% similar) in 206 aa overlap (232-428:225-426) 210 220 230 240 250 260 pF1KB9 PSPPPHLGAHGHAHGHAHAGGLHAAAAHLHPGAGGGGSSVGEHSDEDAPSSDDLEQFAKQ : . . . . : :. . ..:::::: CCDS55 NLLQSQPSITLTSQPATPTRTIAATPIQTLPQSQSTPKRIDTPSLEEPSDLEELEQFAKT 200 210 220 230 240 250 270 280 290 300 310 pF1KB9 FKQRRIKLGFTQADVGLALGTLYGNVFSQTTICRFEALQLSFKNMCKLKPLLNKWLEE-- ::::::::::::.:::::.: :::: :::::: :::::.:::::::::::::.:::.. CCDS55 FKQRRIKLGFTQGDVGLAMGKLYGNDFSQTTISRFEALNLSFKNMCKLKPLLEKWLNDAE 260 270 280 290 300 310 320 330 340 350 360 370 pF1KB9 ---TDSSSGSPTNLDKIAAQG--RKRKKRTSIEVGVKGALESHFLKCPKPSAHEITGLAD .::: .::. :.. . .: :.::::::::.... :::. ::. ::...::: .:: CCDS55 NLSSDSSLSSPSALNSPGIEGLSRRRKKRTSIETNIRVALEKSFLENQKPTSEEITMIAD 320 330 340 350 360 370 380 390 400 410 420 430 pF1KB9 SLQLEKEVVRVWFCNRRQKEKRMTP--AAGAGHPPMDDVYAPGELGPGGGGASPPSAPPP .:..::::.:::::::::::::..: ..:.. :. .. :. : . :. :: CCDS55 QLNMEKEVIRVWFCNRRQKEKRINPPSSGGTSSSPIKAIF-PS---PTSLVATTPSLVTS 380 390 400 410 420 430 440 450 pF1KB9 PPPAALHHHHHHTLPGSVQ CCDS55 SAATTLTVSPVLPLTSAAVTNLSVTGTSDTTSNNTATVISTAPPASSAVTSPSLSPSPSA 440 450 460 470 480 490 >>CCDS55656.1 POU2F1 gene_id:5451|Hs108|chr1 (755 aa) initn: 685 init1: 371 opt: 672 Z-score: 415.3 bits: 86.8 E(32554): 8.3e-17 Smith-Waterman score: 677; 54.4% identity (77.7% similar) in 206 aa overlap (232-428:277-478) 210 220 230 240 250 260 pF1KB9 PSPPPHLGAHGHAHGHAHAGGLHAAAAHLHPGAGGGGSSVGEHSDEDAPSSDDLEQFAKQ : . . . . : :. . ..:::::: CCDS55 NLLQSQPSITLTSQPATPTRTIAATPIQTLPQSQSTPKRIDTPSLEEPSDLEELEQFAKT 250 260 270 280 290 300 270 280 290 300 310 pF1KB9 FKQRRIKLGFTQADVGLALGTLYGNVFSQTTICRFEALQLSFKNMCKLKPLLNKWLEE-- ::::::::::::.:::::.: :::: :::::: :::::.:::::::::::::.:::.. CCDS55 FKQRRIKLGFTQGDVGLAMGKLYGNDFSQTTISRFEALNLSFKNMCKLKPLLEKWLNDAE 310 320 330 340 350 360 320 330 340 350 360 370 pF1KB9 ---TDSSSGSPTNLDKIAAQG--RKRKKRTSIEVGVKGALESHFLKCPKPSAHEITGLAD .::: .::. :.. . .: :.::::::::.... :::. ::. ::...::: .:: CCDS55 NLSSDSSLSSPSALNSPGIEGLSRRRKKRTSIETNIRVALEKSFLENQKPTSEEITMIAD 370 380 390 400 410 420 380 390 400 410 420 430 pF1KB9 SLQLEKEVVRVWFCNRRQKEKRMTP--AAGAGHPPMDDVYAPGELGPGGGGASPPSAPPP .:..::::.:::::::::::::..: ..:.. :. .. :. : . :. :: CCDS55 QLNMEKEVIRVWFCNRRQKEKRINPPSSGGTSSSPIKAIF-PS---PTSLVATTPSLVTS 430 440 450 460 470 480 440 450 pF1KB9 PPPAALHHHHHHTLPGSVQ CCDS55 SAATTLTVSPVLPLTSAAVTNLSVTGTSDTTSNNTATVISTAPPASSAVTSPSLSPSPSA 490 500 510 520 530 540 >>CCDS1259.2 POU2F1 gene_id:5451|Hs108|chr1 (766 aa) initn: 714 init1: 371 opt: 672 Z-score: 415.2 bits: 86.8 E(32554): 8.3e-17 Smith-Waterman score: 677; 54.4% identity (77.7% similar) in 206 aa overlap (232-428:288-489) 210 220 230 240 250 260 pF1KB9 PSPPPHLGAHGHAHGHAHAGGLHAAAAHLHPGAGGGGSSVGEHSDEDAPSSDDLEQFAKQ : . . . . : :. . ..:::::: CCDS12 NLLQSQPSITLTSQPATPTRTIAATPIQTLPQSQSTPKRIDTPSLEEPSDLEELEQFAKT 260 270 280 290 300 310 270 280 290 300 310 pF1KB9 FKQRRIKLGFTQADVGLALGTLYGNVFSQTTICRFEALQLSFKNMCKLKPLLNKWLEE-- ::::::::::::.:::::.: :::: :::::: :::::.:::::::::::::.:::.. CCDS12 FKQRRIKLGFTQGDVGLAMGKLYGNDFSQTTISRFEALNLSFKNMCKLKPLLEKWLNDAE 320 330 340 350 360 370 320 330 340 350 360 370 pF1KB9 ---TDSSSGSPTNLDKIAAQG--RKRKKRTSIEVGVKGALESHFLKCPKPSAHEITGLAD .::: .::. :.. . .: :.::::::::.... :::. ::. ::...::: .:: CCDS12 NLSSDSSLSSPSALNSPGIEGLSRRRKKRTSIETNIRVALEKSFLENQKPTSEEITMIAD 380 390 400 410 420 430 380 390 400 410 420 430 pF1KB9 SLQLEKEVVRVWFCNRRQKEKRMTP--AAGAGHPPMDDVYAPGELGPGGGGASPPSAPPP .:..::::.:::::::::::::..: ..:.. :. .. :. : . :. :: CCDS12 QLNMEKEVIRVWFCNRRQKEKRINPPSSGGTSSSPIKAIF-PS---PTSLVATTPSLVTS 440 450 460 470 480 490 440 450 pF1KB9 PPPAALHHHHHHTLPGSVQ CCDS12 SAATTLTVSPVLPLTSAAVTNLSVTGTSDTTSNNTATVISTAPPASSAVTSPSLSPSPSA 500 510 520 530 540 550 >>CCDS34391.1 POU5F1 gene_id:5460|Hs108|chr6 (360 aa) initn: 677 init1: 603 opt: 651 Z-score: 406.3 bits: 84.1 E(32554): 2.6e-16 Smith-Waterman score: 691; 43.3% identity (62.6% similar) in 321 aa overlap (159-432:9-318) 130 140 150 160 170 pF1KB9 AQGSTAHHLGPAMSPSPGASGGHQPQPLGLYAQAAYPGGGGGGLAG----------MLAA .: . ::::: : .: :. CCDS34 MAGHLASDFAFSPPPGGGGDGPGGPEPGWVDPRTWLSF 10 20 30 180 190 200 210 220 230 pF1KB9 GGGGAGPGLHHALHEDGHEAQLEPSPPPHLGAHGHAH-------GHAHAGGLHAAAAHLH : .:::. .. .. . : :::. : :. : . :::... . . CCDS34 QGPPGGPGIGPGVGPGSEVWGIPPCPPPYEFCGGMAYCGPQVGVGLVPQGGLETSQPEGE 40 50 60 70 80 90 240 250 260 pF1KB9 PGAGGGGSSVGEHSD----------------EDAP--SSD------DLEQFAKQFKQRRI :.: ..: : . :. : :.: .:::::: .::.:: CCDS34 AGVGVESNSDGASPEPCTVTPGAVKLEKEKLEQNPEESQDIKALQKELEQFAKLLKQKRI 100 110 120 130 140 150 270 280 290 300 310 320 pF1KB9 KLGFTQADVGLALGTLYGNVFSQTTICRFEALQLSFKNMCKLKPLLNKWLEETDSSSGSP ::.:::::::.::.:.:.:::::::::::::::::::::::.:::.::.::.:.. CCDS34 TLGYTQADVGLTLGVLFGKVFSQTTICRFEALQLSFKNMCKLRPLLQKWVEEADNNE--- 160 170 180 190 200 210 330 340 350 360 370 380 pF1KB9 TNLDKIA-----AQGRKRKKRTSIEVGVKGALESHFLKCPKPSAHEITGLADSLQLEKEV ::..: .:.:::: ::::: :.: ::. ::.::::. ..:. .:..: :::.: CCDS34 -NLQEICKAETLVQARKRK-RTSIENRVRGNLENLFLQCPKPTLQQISHIAQQLGLEKDV 220 230 240 250 260 270 390 400 410 420 430 440 pF1KB9 VRVWFCNRRQKEKRMTPAAGAGHPPMDDVYAPGELGP-GGGGASPPSAPPPPPPAALHHH ::::::::::: :: ... . .: : : .: .:: .: : :: : CCDS34 VRVWFCNRRQKGKR----SSSDYAQREDFEAAG--SPFSGGPVSFPLAPGPHFGTPGYGS 280 290 300 310 320 450 pF1KB9 HHHTLPGSVQ CCDS34 PHFTALYSSVPFPEGEAFPPVSVTTLGSPMHSN 330 340 350 360 451 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 17:02:57 2016 done: Mon Nov 7 17:02:57 2016 Total Scan time: 3.090 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]