FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB0466, 988 aa 1>>>pF1KB0466 988 - 988 aa - 988 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.8177+/-0.00117; mu= -9.0041+/- 0.071 mean_var=476.6093+/-97.528, 0's: 0 Z-trim(115.3): 21 B-trim: 437 in 1/54 Lambda= 0.058748 statistics sampled from 15817 (15834) to 15817 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.758), E-opt: 0.2 (0.486), width: 16 Scan time: 4.590 The best scores are: opt bits E(32554) CCDS4047.3 JMY gene_id:133746|Hs108|chr5 ( 988) 6486 564.8 3.1e-160 CCDS45333.1 WHAMM gene_id:123720|Hs108|chr15 ( 809) 1176 114.6 8e-25 >>CCDS4047.3 JMY gene_id:133746|Hs108|chr5 (988 aa) initn: 6486 init1: 6486 opt: 6486 Z-score: 2990.2 bits: 564.8 E(32554): 3.1e-160 Smith-Waterman score: 6486; 99.9% identity (100.0% similar) in 988 aa overlap (1-988:1-988) 10 20 30 40 50 60 pF1KB0 MSFALEETLESDWVAVRPHVFDEREKHKFVFIVAWNEIEGKFAITCHNRTAQRQRSGSRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 MSFALEETLESDWVAVRPHVFDEREKHKFVFIVAWNEIEGKFAITCHNRTAQRQRSGSRE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 QAGARGGAEAGGAASDGSRGPGSPAGRGRPEATASATLVRSPGPRRSSAWAEGGSPRSTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 QAGARGGAEAGGAASDGSRGPGSPAGRGRPEATASATLVRSPGPRRSSAWAEGGSPRSTR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 SLLGDPRLRSPGSKGAESRLRSPVRAKPIPGQKTSEADDAAGAAAAAARPAPREAQVSSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 SLLGDPRLRSPGSKGAESRLRSPVRAKPIPGQKTSEADDAAGAAAAAARPAPREAQVSSV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 RIVSASGTVSEEIEVLEMVKEDEAPLALSDAEQPPPATELESPAEECSWAGLFSFQDLRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 RIVSASGTVSEEIEVLEMVKEDEAPLALSDAEQPPPATELESPAEECSWAGLFSFQDLRA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB0 VHQQLCSVNSQLEPCLPVFPEEPSGMWTVLFGGAPEMTEQEIDTLCYQLQVYLGHGLDTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 VHQQLCSVNSQLEPCLPVFPEEPSGMWTVLFGGAPEMTEQEIDTLCYQLQVYLGHGLDTC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB0 GWKILSQVLFTETDDPEEYYESLSELRQKGYEEVLQRARKRIQELLDKHKNTESMVELLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 GWKILSQVLFTETDDPEEYYESLSELRQKGYEEVLQRARKRIQELLDKHKNTESMVELLD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB0 LYQLEDEAYSSLAEATTELYQYLLQPFRDMRELAMLRRQQIKISMENDYLGPRRIESLQK :::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 LYQMEDEAYSSLAEATTELYQYLLQPFRDMRELAMLRRQQIKISMENDYLGPRRIESLQK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB0 EDADWQRKAHMAVLSIQDLTVKYFEITAKAQKAVYDRMRADQKKFGKASWAAAAERMEKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 EDADWQRKAHMAVLSIQDLTVKYFEITAKAQKAVYDRMRADQKKFGKASWAAAAERMEKL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB0 QYAVSKETLQMMRAKEICLEQRKHALKEEMQSLRGGTEAIARLDQLEADYYDLQLQLYEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 QYAVSKETLQMMRAKEICLEQRKHALKEEMQSLRGGTEAIARLDQLEADYYDLQLQLYEV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB0 QFEILKCEELLLTAQLESIKRLISEKRDEVVYYDTYESMEAMLEKEEMAASAYLQREELQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 QFEILKCEELLLTAQLESIKRLISEKRDEVVYYDTYESMEAMLEKEEMAASAYLQREELQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB0 KLQQKARQLEARRGRVSAKKSYLRNKKEICIAKHNEKIQQRTRIEDEYRTHHTVQLKREK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 KLQQKARQLEARRGRVSAKKSYLRNKKEICIAKHNEKIQQRTRIEDEYRTHHTVQLKREK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB0 LHDEEERKSAWVSQERQRTLDRLRTFKQRYPGQVILKSTRLRLAHARRKGAASPVLQEDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 LHDEEERKSAWVSQERQRTLDRLRTFKQRYPGQVILKSTRLRLAHARRKGAASPVLQEDH 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB0 CDSLPSVLQVEEKTEEVGEGRVKRGPSQTTEPQSLVQLEDTSLTQLEATSLPLSGVTSEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 CDSLPSVLQVEEKTEEVGEGRVKRGPSQTTEPQSLVQLEDTSLTQLEATSLPLSGVTSEL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB0 PPTISLPLLNNNLEPCSVTINPLPSPLPPTPPPPPPPPPPPPPPPLPVAKDSGPETLEKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 PPTISLPLLNNNLEPCSVTINPLPSPLPPTPPPPPPPPPPPPPPPLPVAKDSGPETLEKD 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB0 LPRKEGNEKRIPKSASAPSAHLFDSSQLVSARKKLRKTAEGLQRRRVSSPMDEVLASLKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 LPRKEGNEKRIPKSASAPSAHLFDSSQLVSARKKLRKTAEGLQRRRVSSPMDEVLASLKR 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB0 GSFHLKKVEQRTLPPFPDEDDSNNILAQIRKGVKLKKVQKDVLRESFTLLPDTDPLTRSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 GSFHLKKVEQRTLPPFPDEDDSNNILAQIRKGVKLKKVQKDVLRESFTLLPDTDPLTRSI 910 920 930 940 950 960 970 980 pF1KB0 HEALRRIKEASPESEDEEEALPCTDWEN :::::::::::::::::::::::::::: CCDS40 HEALRRIKEASPESEDEEEALPCTDWEN 970 980 >>CCDS45333.1 WHAMM gene_id:123720|Hs108|chr15 (809 aa) initn: 1805 init1: 1080 opt: 1176 Z-score: 559.1 bits: 114.6 E(32554): 8e-25 Smith-Waterman score: 1579; 36.7% identity (64.2% similar) in 790 aa overlap (214-987:63-808) 190 200 210 220 230 240 pF1KB0 SASGTVSEEIEVLEMVKEDEAPLALSDAEQPPPATELESPAEECSWAGLFSFQDLRAVHQ : : . :. . :::::.: ::..:. CCDS45 AWNGAEGKFAVTCHDRTAQQRRLREGARLGPEPEPKPEAAVSPSSWAGLLSAAGLRGAHR 40 50 60 70 80 90 250 260 270 280 290 pF1KB0 QLCSVNSQLEPCLPVFPEEPS-----------GMWTVLFGGAPEMTEQEIDTLCYQLQVY :: .. :: :.: .: : . :.:..:. : .. :: ::. : CCDS45 QLAALWPPLERCFPRLPPELDVGGGGAWGLGLGLWALLWPTRAGPGEAALQELCGQLERY 100 110 120 130 140 150 300 310 320 330 340 350 pF1KB0 LGHGLDTCGWKILSQVLFTETDDPEEYYESLSELRQKGYEEVLQRARKRIQELLDKHKNT :: . : :: . ..:: . :: :.:... . .: :...... : .. CCDS45 LGAAADGCGGATVRDALFPAEGGAADC-ESPREFRERALRARWVEADARLRQVIQGHGKA 160 170 180 190 200 210 360 370 380 390 400 410 pF1KB0 ESMVELLDLYQLEDEAYSSLAEATTELYQYLLQPFRDMRELAMLRRQQIKISMENDYLGP ..:: :...:: :::::. :. ..: ..:::::::: :::.: : . .: :...: ::: CCDS45 NTMVALMNVYQEEDEAYQELVTVATMFFQYLLQPFRAMREVATLCKLDILKSLDEDDLGP 220 230 240 250 260 270 420 430 440 450 460 470 pF1KB0 RRIESLQKEDADWQRKAHMAVLSIQDLTVKYFEITAKAQKAVYDRMRADQKKFGKASWAA ::. .:.:: .: :.:. ::.::::.::.::. :.:: .. .:. : :.::.:.::. CCDS45 RRVVALEKEAEEWTRRAEEAVVSIQDITVNYFKETVKALAGMQKEMEQDAKRFGQAAWAT 280 290 300 310 320 330 480 490 500 510 520 530 pF1KB0 AAERMEKLQYAVSKETLQMMRAKEICLEQRKHALKEEMQSLRGGTEAIARLDQLEADYYD : :.:::: ...::::.:::::.::.... .. .:..: . .:.:: ..:. CCDS45 AIPRLEKLQLMLARETLQLMRAKELCLNHKRAEIQGKMEDLPEQEKNTNVVDELEIQFYE 340 350 360 370 380 390 540 550 560 570 580 590 pF1KB0 LQLQLYEVQFEILKCEELLLTAQLESIKRLISEKRDEVVYYDTYESMEAMLEKEEMAASA .::.::::.::::: ::.:::.::.:.::::.::.::::::: :. : . . ... CCDS45 IQLELYEVKFEILKNEEILLTTQLDSLKRLIKEKQDEVVYYDPCENPEELKVIDCVVGLQ 400 410 420 430 440 450 600 610 620 630 640 650 pF1KB0 YLQREELQKLQQKARQLEARRGRVSAKKSYLRNKKEICIAKHNEKIQQRTRIEDEYRTHH . :...:... .:::..:::. ::.. ::..:. : .: ..:: . : :: CCDS45 DDKNLEVKELRRQCQQLESKRGRICAKRASLRSRKDQCKENHRFRLQQAEESIRYSRQHH 460 470 480 490 500 510 660 670 680 690 700 710 pF1KB0 TVQLKREKLHDEEERKSAWVSQERQRTLDRLRTFKQRYPGQVILKSTRLRLAHARRKGAA ..:.::.:...::..:. :..::::.::.:::.::.. :::.. :. .. CCDS45 SIQMKRDKIKEEEQKKKEWINQERQKTLQRLRSFKDK------------RLAQSVRNTSG 520 530 540 550 720 730 740 750 760 770 pF1KB0 S-PVLQEDHCDSLPSVLQVEEKTEEVGEGRVKRGPSQTTEPQSLVQLEDTSLTQLEATSL : :: .::: :. . : . :. :. : : ... .. : CCDS45 SEPV-----APNLPSDLSQQMCLPASHAVSVIHPSSRKTRG---VPLSEAG----NVKSP 560 570 580 590 600 780 790 800 810 820 830 pF1KB0 PLSGVTSELPPTISLPLLNNNLEPCSVTINPLPSPLPPTPPPPPPPPPPPPPPPLPVAKD .. ...: . .:. . . : . . : : :: :::::::::::::::: . .. CCDS45 KCQNCHGNIPVQVFVPVGD---QTHSKSSEELSLPPPPPPPPPPPPPPPPPPPPLRALSS 610 620 630 640 650 660 840 850 860 870 880 890 pF1KB0 SGPETLEKDLPRKEGNEKRIPKSASAPSAHLFDSSQLVSARKKLRKTAEGLQRRRVSSPM :. . ...: : : . . : . .: .. ..:. . : CCDS45 SSQAATHQNLGF------RAPVKDDQPRPLVCESPA--------ERPRDSLESFSCPGSM 670 680 690 700 710 900 910 920 930 940 950 pF1KB0 DEVLASLKRGSFHLKKVEQRTLPPFPDEDDSNNILAQIRKGVKLKKVQKDVLRESFTLLP :::::::..: :.::: .. : : . ...::: ::.:::::::. : : . . : CCDS45 DEVLASLRHGRAPLRKVEVPAVRP-PHASINEHILAAIRQGVKLKKVHPD-LGPNPSSKP 720 730 740 750 760 960 970 980 pF1KB0 D----TDPLTRSIHEALRRIKEASPESEDEEEALPCTDWEN :. : :::. ::.:::..: .::.. . .:. CCDS45 TSNRRTSDLERSIKAALQRIKRVSADSEEDSDEQDPGQWDG 770 780 790 800 988 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 17:12:29 2016 done: Sun Nov 6 17:12:30 2016 Total Scan time: 4.590 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]